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图 灵 社 区 的 电子 书 没有 采用 专 有 客 
户 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
己 喜 欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 
用 ， 未 经 授权 ， 不 得 进行 传播 。 
我 们 愿意 相信 读者 具有 这 样 的 良知 
和 觉悟 ， 与 我 们 共同 保护 知识 产 
权 。 

如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 户 实施 包括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 追究 法 律 
责任 。 


中 村 成 洋 


Network Applied Communication 
Laboratory Ltd. 研究 员 。 

因为 偶然 的 机 会 对 GC 产生 浓厚 兴趣 ， 

其 本 人 却说 不 清楚 为 何 喜欢 GC， 当 被 
人 追问 原因 时 ， 总 是 回答 "是 缘分 "。 

现在 是 CRuby 的 commiter， 每 天 致力 
于 GC 的 改善 。 

执笔 本 书 "实现 篇 "。 


相川 光 


游戏 开发 者 。 

京都 大 学 在 学 期 间 开始 研 究 GC。 
热爱 GC 但 讨厌 打扫 。 

除了 GC 之 外 还 喜欢 咖 哇 。 
执笔 本 书 "算法 篇 "。 


行内 郁 雄 


东京 大 学 名 誉 教授 。 

热爱 对 象 ， 甚 至 会 给 因为 bug 没 能 得 到 
重复 利用 而 死去 ( 释放 ) 的 对 象 上 供 。 
日 本 著名 的 LISP 黑 客 ， 著 有 《LISP 入 
门 》( 初 区 TD 人 大 区 DLISP ) 。 
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内 容 提要 


本 书 分 为 “算法 篇 ”和 “实现 篇 ”两 大 部 分 。 算 法 篇 介绍 了 标记 - 清除 算法 、 引 用 计数 法 、 复 制 算 
法 、 标 记 - 压缩 算法 、 保 守 式 GC 、 分 代 垃 圾 回收 、 增 量 式 垃圾 回收 、RC Immix 算法 等 几 种 重要 的 算法 ; 
实现 篇 介绍 了 垃圾 回收 在 Python 、DalvikVM 、Rubinius 、V8 等 几 种 语言 处 理 程序 中 的 具体 实现 。 

本 书 适合 各 领域 程序 员 阅 读 。 
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计算 机 的 进步 ， 特 别 是 硬件 的 发 展 之 快 总 是 让 我 们 感到 惊讶 。 在 这 波 不 断 向 前 涌 动 的 洪 
流 中 ， 技 术 领 域 的 浮沉 也 愈 发 激烈 。 本 书 涉及 的 垃圾 回收 (Garbage Collection，GC ) 与 其 说 是 
理论 ， 其 实 更 偏向 技术 层面 ， 然 而 它 却 有 着 令 人 吃惊 的 漫长 历史 。GC 在 计算 机 发 展 的 激流 
中 没有 浮 起 ， 也 没有 沉 下 。 直 到 1995 年 Java 发 布 ， 因 为 其 内 藏 CC， 人 们 才 开 始 意 识 到 GC 
的 作用 。 

追溯 Lisp 语言 的 秘史 我 们 会 发 现 ，GC 这 种 让 已 经 无 法 利用 的 内 存 实现 自动 再 利用 (可 
能 称 为 “内 存 资源 回收 ” 更 恰当 ) 的 技术 ， 是 于 Lisp 的 设计 开始 约 1 年 后 ， 也 就 是 1959 年 的 
夏天 首次 出 现 的 。 实 现 GC 的 是 一 个 叫 D. Edwards 的 人 。 至 今 已 经 经 过 了 50 多 年 的 漫长 岁月 。 

这 期 间 人 们 进行 了 海量 的 研究 和 开发 , 与 其 相关 的 论文 也 堆积 如 山 。 这 么 说 来 ,我 也 
写 过 几 篇 关于 GC 的 论文 。 然 而 让 我 吃惊 的 是 ， 这 么 久 以 来 竟然 没有 一 本 关于 GC 的 教科 
书 或 专业 书籍 。 英 语 界 曾 于 1996 年 首次 针对 GC 出 版 了 一 本 Garbage Collection (Richard 
E. Jones 、Rafael D. Lins 著 )， 这 是 37 年 来 在 GC 领域 的 一 次 破天荒 的 壮举 ， 本 书 也 将 其 作为 
了 参考 文献 。 然 而 在 日 本 ， 本 书 可 以 说 是 第 一 本 用 日 语 写 的 GC 专业 图 书 ， 可 谓 五 十 年 磨 一 剑 ， 
在 此 也 对 年 轻 有 为 的 二 位 作者 致 以 深 深 的 敬意 。 

如 果 看 看 某 本 教科 书 中 的 一 节 或 者 读 读 几 篇 论文 就 能 明白 GC 是 什么 东西 ， 那 么 或 许 就 
不 需要 这 本 书 了 , 但 GC 并 没有 那么 简单 。 在 学 习 或 工作 中 不 得 不 使 用 GC 的 人 ， 首 先 就 必 
须 看 两 三 篇 有 名 的 论文 ， 之 后 还 要 去 研究 那些 可 能 与 其 有 关 的 原著 。 也 就 是 说 ， 从 某 种 意义 
上 而 言 ， 最 后 还 是 需要 自己 去 想 很 多 东西 。 

尽管 如 此 ， 还 是 有 许多 真心 喜欢 编程 的 人 士 ， 他 们 之 中 有 一 大 群 叫 作 GCLover 的 人 。 因 
为 GC 基本 上 没有 什么 教科 书 ， 所 以 这 群 人 之 间 似 乎 有 着 一 种 地 下 组 织 般 的 团队 意识 。 总 而 
言 之 ， 对 他 们 来 说 ，GC 是 个 非常 有 意思 、 充 满 乐 趣 的 程序 。 你 读 过 本 书后 就 会 明白 ，GC 算 
法 会 根据 自动 内 存 回收 所 需 的 环境 (机 器 、 语 言 、 应 用 等 ) 的 不 同 而 不 同 。 到 具体 的 程序 层面 ， 
GC 则 为 程序 员 提 供 了 一 个 最 佳 的 游乐 场所 , 令 其 尽情 地 发 挥 编程 技巧 ， 大 展 身手 。 事 实 上 
我 也 属于 长 年 乐 在 其 中 的 一 份子 。GC 这 东西 很 麻烦 ， 但 却 是 必需 的 。 它 就 像 一 个 幕后 英雄 ， 
默默 地 做 着 贡献 ， 用 户 并 不 会 期 待 它 变 得 显眼 。 但 因为 它 进 行 的 是 幕后 工作 ， 所 以 编程 老手 
们 或 许 会 为 之 心动 。 

如 上 所 述 ， 因 为 Java 的 出 现 ， 人 们 开始 普遍 认识 到 GC 的 可 贵 ， 自 此 多 数 的 脚本 语言 都 
具备 了 GC。 看 到 这 种 情形 ， 我 这 个 跟 GC 拉 拉 扯 扯 了 近 40 年 的 人 真是 感慨 万 千 。 虽然 没有 
什么 切实 的 根据 ， 但 是 我 一 直 认 为 ,具备 GC 的 语言 要 比 不 具备 GC 的 同等 语言 生产 效率 高 
百 分 之 三 十 。 

























































































































































































审 校 者 前 言 














既然 话说 到 这 里 了 ,我 就 再 介绍 一 下 我 的 个 人 看 法 吧 。 实 际 上 ，GC 相当 于 虚拟 内 存 。 
一 般 的 虚拟 内 存 技术 是 在 较 小 的 物理 内 存 的 基础 上 ， 利 用 辅助 存储 创造 一 We 
拟 ” 地 址 空间 。 也 就 是 说 ，GC 是 扩大 内 存 空间 的 技术 ， 因 此 我 称 其 为 空间 性 虚拟 存储 。 
样 一 来 ，GC 就 成 了 永久 提供 一 次 性 存储 空 Ee a eg. 人 
比 起 称 为 “垃圾 回收 ”"， 把 GC 称 为 “虚拟 内 存 ” 令 人 感觉 其 重要 了 许多 。 当 初 人 们 根据 计算 
机 体系 结构 开发 了 许多 关于 空 We 所 以 大 部 分 的 计算 机 都 标 配 了 空 s 间 性 虚 
拟 存储 。 只 要 硬件 支持 ，GC 性 能 就 能 稳步 提升 ， 然 而 现实 情况 是 几乎 没有 支 持 GC 的 硬件 ， 
这 不 能 不 令 人 感到 遗憾 。 

要 说 本 书 与 涵盖 面 较 广 的 Garbage Collection 有 什么 不 同 ， 那 就 是 本 书 涉及 的 面 不 那么 
广 ,， 但 “算法 篇 ”中 对 GC 的 基础 内 容 进 行 了 详实 的 讲解 。 男 外 ,“ 实 现 篇 ”是 本 书 的 一 大 特色 ， 
其 中 解读 了 实际 的 GC 代码 。 总 体 而 言 ， 本 书 作为 一 本 教科 书 有 着 教育 和 现实 意义 。 我 作为 
本 书 审 校 者 ， 全 方位 检查 、 琢 磨 了 书 中 的 内 容 ， 担 保 这 是 一 本 通俗 易 懂 的 书 。 我 深信 ， 本 书 
作为 一 本 GC 专业 图 书 ， 能 让 读者 了 解 到 GC 是 何 物 ， 体 味 到 它 的 有 趣 之 处 以 及 它 的 重要 性 。 

如 果 能 让 更 多 读者 了 解 到 GC 的 重要 性 ,那么 由 硬件 和 0S 支持 GC 的 真 的 时 间 性 虚拟 
存储 总 有 一 天 会 实现 吧 。 这 就 是 我 发 自 肺腑 想 说 的 话 。 开 折 新 技术 的 原石 正在 滚滚 前 进 哦 ! 

























































































东京 大 学 情报 理工 学 系 研究 科教 授 ”人 竹内 郁 雄 
2010 年 2 月 





注意 

1. 本 书 是 作者 个 人 的 研究 成 果 。 

2. 本 书 内 容 已 经 过 严格 的 审查 和 勘误 ， 如 发 现 内 容 缺 失 、 错 误 等 ， 请 以 书面 形式 联络 出 版 方 。 

3. 关 于 运用 本 书 内 容 所 造成 的 任何 结果 ， 作 译 者 及 出 版 社 不 承担 与 上 述 两 项 无 关 的 责任 ， 敬 请 谅解 。 
4. 未 经 出 版 方 书面 许可 ， 不 得 擅自 盗 印 本 书 内 容 。 





























关于 商标 

。 本 书 中 省 略 了 ®@、© 、 等 符号 ， 敬 请 谅解 。 

。 关 于 本 书 中 涉及 的 程序 名 称 、 系 统 名 称 及 CPU 名 称 等 ， 书 中 一 律 使 用 其 最 常用 的 称呼 。 

。 一 般 情况 下 ， 本 书 中 使 用 的 程序 名 称 、 系 统 名 称 及 CPU 名 称 等 为 各 公司 的 商标 或 注册 商标 。 
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净 是 拿 比 自己 弱 的 人 当 对 手 ， 不 可 能 有 意思 。 

没有 人 能 一 看 到 谜 题 就 瞬间 和 解 出 答案 。 

读 到 一 半 就 知道 犯人 的 推理 小 说 真是 无 聊 透顶 。 

将 自身 能 力 发 挥 至 极限 去 解 开 问题 ， 这 时 才能 把 知识 变 成 自己 的 东西 。 
一 一 青木 峰 郎 《Ruby 源 代码 完全 解读 》 了 


本 书 中 涉及 以 下 两 个 主题 。 


1. GC 的 算法 (算法 篇 ) 
2. GC 的 实现 (实现 篇 ) 


在 “算法 篇 " 中 ,我们 从 众多 的 GC 算法 中 严格 挑选 了 一 些 重要 的 算法 来 介绍 ， 包 括 传 
统 算 法 和 基本 算法 ， 以 及 稍微 难 一 些 的 算法 。 ”算法 篇 ”最 大 的 目的 是 让 你 了 解 GC 独特 的 思 
维 方式 和 各 算法 的 特性 。 

在 “实现 篇 ”中 ， 你 需要 逐步 阅读 我 们 选择 的 语言 处 理 程序 的 GC 算法 。 因 为 我 们 在 “ 算 
法 篇 ”中 扎实 地 学 习 了 理论 ， 所 以 需要 在 “实现 篇 ”中 检验 一 下 能 把 理论 运用 到 什么 程度 。 

特地 设计 “实现 篇 ”还 有 一 个 目的 ， 就 是 想 让 你 亲身 感受 “理论 和 实现 的 不 同 "。 要 成 功 
实现 ， 不 仅 要 使 用 GC 算法 ， 还 要 在 细节 上 下 很 多 功夫 ， 以 与 硬件 环境 和 语言 功能 相 协调 。 
过 学 习 更 有 实践 性 意义 的 知识 ， 硕 望 能 进一步 加 你 对 GC 的 理解 。 

此 外 ， 随 着 深入 阅读 GC， 你 会 有 男 一 种 惊喜 ， 即 加 深 了 对 语言 处 理 程序 的 认识 。 语 言 
处 理 程序 是 由 数 万 行 代码 群 构成 的 巨大 程序 。 在 阅读 这 样 巨 大 的 程序 时 ， 如 果 没 有 一 个 明确 
的 目标 ,那么 就 很 难 继续 往 下 读 。 这 就 好 比 挖 坑 ， 如 果 往 深 处 挖 ， 坑 的 直径 就 会 自然 而 然 地 
扩大 。 同 理 ， 如 果 我 们 去 深入 理解 某 一 点 ,那么 也 就 会 逐渐 理解 其 整体 “实现 篇 ” 就 是 在 
持续 挖掘 GC 这 个 深 坑 。 我 们 深信 ， 这 项 工作 有 助 于 加 深 我 们 对 语言 处 理 程序 的 整体 理解 。 
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中 村 成 洋 、 相 川 光 
2010 年 1 月 





@ 原 书 名 潭 Ruby 一 又 过 一 下 完全 解说 1( Ruby Hacking Guide )， 目 前 尚 无 中 文 版 。 一 一 译 者 注 
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来 自 相 川 光 的 谢 辞 

在 此 向 京都 大 学 的 汤 浅 太一 老师 致 以 谢意 ， 是 您 令 我 邂逅 了 GC。 

在 此 对 东京 大 学 的 本 位 田 真一 教授 和 本 位 田 研究 室 的 各 位 致 以 诚挚 的 感谢 。 感 谢 各 位 在 
本 书 执笔 期 间 给 予 的 全 面 支持 。 

从 心底 感谢 远 在 涕 贺 县 、 一 直 温 柔 守 护 我 的 爸爸 妈妈 以 及 妹妹 。 














本 书评 论 


在 这 里 ， 我 们 请 阅读 过 本 书 原 稿 的 人 士 发 表 了 一 下 他 们 对 本 书 的 看 法 ， 如 下 所 示 ( 姓 名 
按 五 十 音 顺序 和 字母 顺序 排列 ， 敬 称 略 去 )。 





齐 蕨 Tadashi 

我 是 个 门外汉 ， 所 以 刚 开 始 还 挺 担心 自己 能 不 能 理解 呢 ! 不 过 书 中 的 讲解 十 分 细致 ， 作 
者 把 每 个 知识 点 都 猎 开 嚼 碎 了 ， 让 我 非常 享受 这 个 学 习 过 程 。 非 常 期 待 中 村 和 相川 两 位 老师 
的 下 一 部 作品 。 




















中 川 真 宏 

大 都 都 管 我 叫 D 语言 传教 士 , 我 每 天 都 在 想 着 怎么 改变 一 下 DD 语言 。 就 在 这 时 ， 我 过 
见 了 这 本 书 。 这 本 书 肯定 能 教会 每 个 人 创建 自己 的 GC。 大 家 也 不 妨 试 试 做 出 自己 的 GC， 享 
受精 彩 的 编程 生活 吧 ! 








三 浦 英 树 

我 是 一 名 喜欢 Lisp 和 Ruby 的 水 管 工 ， 喜 欢 写 语 言 处 理 程序 ， 在 学 生 时 代 就 写 过 GC 标 
记 - 清除 算法 和 GC 复制 算法 。 不 过 太 迟 了 ,非常 遗憾 当年 没有 出 现 这 本 书 ， 没 能 知道 其 中 
介绍 的 各 种 各 样 的 技巧 ! 通过 本 书 我 学 到 了 非常 多 的 东西 ! 



































k.inaba 

我 喜欢 Code Golf 和 编程 竞赛 ， 是 一 个 代码 玩家 。 关 于 CC， 我 只 知道 一 些 基 本 理论 ， 
于 是 就 战 战 葛 航 地 赁 着 对 GC 的 一 点 了 解 阅读 了 本 书 原稿 。 然 后 我 发 现 ， 通 过 基本 算法 知识 
的 积累 ， 慢 慢 就 能 理解 一 般 语言 处 理 程序 中 使 用 的 具有 一 定 规模 的 GC 源 代码 了 。 体 会 到 这 
一 点 的 时 候 别 提 有 多 开心 了 ! 

















mokehehe 
刚 开 始 我 半信半疑 地 试 着 用 了 下 GC， 然 后 就 交 到 了 女 朋 友 ! 我 已 经 没 法 想象 没有 GC 
的 日 子 了 ! 我 要 把 这 份 喜悦 分 享 给 大 家 ! 











Q 代码 高 尔 夫 ， 计 算 机 编程 竞赛 的 一 种 ， 参 加 者 要 尽 可 能 用 最 短 的 源 代 码 描述 给 出 的 算法 。 一 一 译 者 注 
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在 序章 中 ， 我们 将 对 什么 是 GC、GC 的 历史 、 学 习 GC 的 目的 进行 简要 说 明 。 此 外 还 
将 说 明 阅 读本 书 时 的 注意 事项 。 

















GC 是 Garbage Collection 的 简称 ， 中 文 称 为 “垃圾 回收 ”。 


垃圾 的 回收 


Garbage Collection 的 Garbage， 也 就 是 “垃圾 ”"， 具 体 指 的 是 什么 呢 ? 

在 现实 世界 中 ， 说 到 垃圾 ， 指 的 就 是 那些 不 读 的 书 、 不 穿 的 衣服 每 。 这 种 情况 下 的 “垃圾 ” 
指 的 是 “自己 不 用 的 东西 ”。 

在 GC 中,“ 垃 圾 ”的 定义 也 是 如 此 。GC 把 程序 不 用 的 内 存 空间 视 为 垃圾 。 关 于 “垃圾 ” 
的 详细 介绍 ， 我 们 会 在 1.5 节 进 行 阐述 。 
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序章 
GC 要 做 两 件 事 
GC 要 做 的 有 两 件 事 。 


1. 找到 内 存 空 间 里 的 垃圾 
2. 回收 垃圾 ， 让 程序 员 能 再 次 利用 这 部 分 空间 





满足 这 两 项 功能 的 程序 就 是 CC。 


GC 到 底 会 给 程序 员 率 来 怎样 的 好 处 呢 ? 


没有 GC 的 世界 


在 没有 GC 的 世界 里 ， 程 序 员 必须 自己 手动 进行 内 存 管理 ， 必 须 清楚 地 确保 必要 的 内 存 
空间 ， 释 放 不 要 的 内 存 空间 。 

程序 员 在 手动 进行 内 存 管理 时 ， 申 请 内 存 尚 不 存在 什么 问题 ， 但 在 释放 不 要 的 内 存 空间 
时 ， 就 必须 一 个 不 漏 地 释放 。 这 非常 地 麻烦 。 

如 果 忘 记 释放 内 存 空间 ， 该 内 存 空间 就 会 发 生 内 存 泄露 “， 即 无 法 被 使 用 ， 但 它 又 会 持续 
存在 下 去 。 如 果 将 发 生 内 存 泄露 的 程序 放 着 不 管 ， 总 有 一 刻 内 存 会 被 占 满 ， 甚 至 还 可 能 导致 
系统 月 溃 。 

另外 ,在 释放 内 存 空 间 时 ， 如 果 忘 记 初始 化 指向 释放 对 象 的 内 存 空 间 的 指针 ， 这 个 指针 
就 会 一 直 指 向 释放 完毕 的 内 存 空间 。 因 为 这 个 指针 没有 指向 有 效 的 内 存 空间 ， 处 于 一 种 悬挂 
的 状态 ， 所 以 我 们 称 其 为 “悬垂 指针 ”(dangling pointer)。 如 果 在 程序 中 错误 地 引用 了 悬垂 指针 ， 
就 会 产生 无 法 预期 的 BUG。 此 外 ， 甚 垂 指 针 也 会 导致 严重 的 安全 漏洞 2。 

更 有 其 者 ， 还 可 能 会 出 现 错误 释放 了 使 用 中 的 内 存 空间 的 情况 。 一 旦 错误 释放 了 使 用 中 
的 内 存 空 间 ， 下 一 次 程序 使 用 此 空间 时 就 会 发 生 故 障 。 大 多 数 情 况 下 会 发 生 段 错误 ， 运 气 不 
好 的 话 还 可 能 引发 恶性 BUG。 

上 述 这 样 与 内 存 相 关 的 BUG， 其 共通 之 处 在 于 “难以 确定 BUG 的 原因 ”。 我 们 都 知道 ， 
与 内 存 相 关 的 BUG 的 潜在 场所 和 BUG 出 现 的 场所 在 位 置 上 (或 者 是 时 间 上 ) 不 一 致 ， 所 以 很 
难 确 定 BUG 的 原因 。 













































































@ 内存 泄露 : 内 存 空间 在 使 用 完毕 后 未 释放 。 
@ 2009 年 IE6/7 的 零 日 漏洞 曾 缀 动 一 时 。 一 一 译 者 注 





GC 的 历史 3 


有 GC 的 世界 


为 了 省 去 上 述 手动 内 存 管 理 的 麻烦 ， 人 们 钴 研 开发 出 了 GC。 如 果 把 内 存 管理 交 给 计算 机 ， 
程序 员 就 不 用 去 想 着 释放 内 存 了 。 

在 手动 内 存 管 理 中 ， 程 序 员 要 判断 哪些 是 不 用 的 内 存 空间 (垃圾 )， 留 意 内 存 空间 的 寿命 。 
但 只 要 有 GC 在 ,这 一 切 都 可 以 交 给 GC 来 做 。 

有 了 GC， 程 序 员 就 不 用 再 去 担心 因为 忘 了 释放 内 存 等 而 导 至 BUG， 从 而 大 大 减轻 了 负担 。 
也 不 用 再 去 头疼 费事 的 内 存 管理 。GC 能 让 程序 员 告 别 恼人 的 内 存 管理 ， 把 精力 集中 在 更 本 
质 的 编程 工作 上 。 


GC 是 一 门 古老 的 技术 


据 笔者 所 知 ，GC 因为 Java 的 发 布 而 一 举 成 名 ， 所 以 很 多 人 可 能 会 认为 GC 是 最 近 才 有 
的 技术 。 不 过 GC 有 着 非常 久远 的 历史 ， 最初 的 GC 算法 是 John McCarthy 在 1960 年 发 布 的 。 


GC 标记 一 清除 算法 


John McCarthy 身 为 Lisp 之 父 和 人 工 智能 之 父 ， 是 一 名 非常 有 名 的 黑客 ， 事实 上 他 同时 
也 是 GC 之 父 (多 么 伟大 的 黑客 啊 )。 

1960 年 ，McCarthy 在 其 论文 叫 中 首次 发 布 了 GC 算法。 

当然 ， 当 时 还 没有 Garbage Collection 这 个 词 。 证 据 就 在 这 篇 论文 的 脚注 之 中 ， 如 下 所 示 。 




















我 们 把 这 个 功能 称 为 Garbage Collection。 
但 是 我 们 没有 在 这 篇 论文 中 用 到 这 个 名 称 。 
































要 是 我 想 用 ， 了 芭 怕 咬文嚼字 研究 所 的 女士 们 都 会 过 来 阻拦 我 吧 。 














给 人 感觉 很 青 涩 呢 。 


在 这 篇 论文 中 发 布 的 算法 ， 就 是 现在 我 们 所 说 的 GC 标记 - 清除 算法 。 
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序章 


引用 计数 法 

1960 年 ，George E. Collins 在 论文 四 中 发 布 了 叫 作 引 用 计数 的 GC 算法 。 

当时 Collins 可 能 没有 注意 到 ， 引 用 计数 法 有 个 缺点 ， 就 是 它 不 能 回收 “循环 引用 ”了 。 
Harold McBeth 2 在 1963 年 指出 了 这 个 缺点 。 
GC 复制 算法 

1963 年 ， 也 有 “人 工 智 能 之 父 ” 之 称 的 Marvin L. Minsky 在 论文 中 中 发 布 了 复制 算法 。 

GC 复制 算法 把 内 存 分 成 了 两 部 分 ， 这 篇 论文 中 将 第 二 部 分 称 为 磁带 存储 空间 。 不 得 不 
说 带 有 浓烈 的 时 代 色 彩 。 
50 年 来 ，GC 的 根本 都 没有 改变 

从 50 年 前 GC 算法 首次 发 布 以 来 ， 众 多 研究 者 对 其 进行 了 各 种 各 样 的 研究 ， 因 此 许多 
GC 算法 也 得 以 发 布 。 

但 事实 上 ， 这 些 算法 只 不 过 是 把 前 文中 提 到 的 三 种 算法 进行 组 合 或 应 用 。 也 可 以 这 么 说 ， 
1963 年 GC 复制 算法 诞生 时 ，GC 的 根本 性 内 容 就 已 经 完成 了 。 
未 知 的 第 四 种 算法 

现在 为 世人 所 知 的 GC 算法 ， 不 过 是 从 之 前 介绍 的 三 种 基本 算法 中 衍生 出 来 的 产物 。 

本 书 中 除了 细致 介绍 这 些 基 本 的 GC 算法 ， 还 会 介绍 应 用 到 它们 的 GC 算法 。 把 这 些 算 
法 全 看 完 后 ， 请 跟 笔 者 一 起 ， 就 GC 的 课题 进行 思考 。 

也 许 发 现 全 新 的 第 四 种 基本 算法 的 人 ， 就 是 你 。 


为 什么 我 们 现在 要 学 6C 


为 什么 我 们 现在 有 必要 学 习 GC 的 原理 ? 有 以 下 几 个 原因 。 


GC 一 一 存在 即 合理 
现在 我 们 使 用 的 多 数 编程 语言 都 搭载 有 GC。 以 下 是 几 个 具体 的 例子 。 

















“Lisp “Python 
“ Java " Perl 
* Ruby * Haskell 

















由 





人 @D 循环 引用 : 两 个 及 两 个 以 上 对 象 循环 互相 引用 。 详 细 内 容 请 参考 第 

















为 什么 我 们 现在 要 学 GC 5 


大 家 有 没有 使 用 过 其 中 的 某 种 编程 语言 呢 ? 如 果 使 用 过 ， 当 时 应 该 也 在 不 知 不 觉 中 获得 
了 GC 带 来 的 好 处 。 

对 编程 语言 来 说 ，GC 就 是 一 个 无 名 英雄 ,默默 地 做 着 贡献 。 打 个 比方 ， 天 笋 在 水 面 优 
雅 地 游 动 时 ， 实 际 上 脚 中 却 在 水 下 拼命 地 划 着 水 。GC 也 是 如 此 。 在 由 编程 语言 构造 的 美丽 
的 源 代码 这 片 水 下 ，GC 在 拼命 地 将 垃圾 回收 再 利用 。 

如 上 所 述 ，GC 是 语言 处 理 程序 中 非常 重要 的 一 部 分 ， 相 当 于 树 荫 。 应 该 有 很 多 人 感觉 “GC 
帮忙 回收 垃圾 是 理所当然 ”的 吧 ? 

GC 基本 上 是 高 负载 处 理 ， 需 要 花费 一 定 的 时 间 。 打 个 比方 ， 当 编写 像 动作 游戏 这 样 追 
求 即 时 性 的 程序 时 ， 就 必须 尽量 压低 GC 导致 的 最 大 暂停 时 间 。 如 果 因 为 GC 导致 玩家 频繁 
卡 顿 ， 相 信 谁 都 会 想 摔 手 柄 。 碰 到 这 种 应 用 ， 我 们 就 需要 选择 最 大 和 暂停 时 间 较 短 的 GC 算法 了 。 

再 打 个 比方 ， 对 音乐 和 动画 这 样 类 似 于 编码 应 用 的 程序 来 说 ，GC 的 最 大 暂停 时 间 就 不 
那么 重要 了 。 更 为 重要 的 是 ， 我 们 必须 选择 一 个 整体 处 理 时 间 更 短 的 算法 。 

笔者 深信 ,事先 知道 “这 个 GC 算法 有 这 样 的 特征 ， 所 以 它 适 合 这 个 应 用 ”对 程序 员 来 
说 很 有 价值 。 

如 果 我 们 不 理所当然 地 去 利用 GC， 而 是 去 了 解 其 内 部 情况 ， 自 己 来 评价 GC 算法 ,， 那 
么 自身 的 编程 水 平 就 一 定 会 得 到 提高 吧 。 


多 种 多 样 的 处 理 程序 的 实现 

近年 来 ， 随 着 编程 语言 的 发 展 ， 燃 起 了 一 股 发 布 语言 处 理 程序 的 势头 ， 这 些 语言 处 理 程 
序 都 搭载 有 不 同 的 GC 算法 。 作 为 语言 处 理 程序 的 关键 功能 ， 很 多 人 将 采用 了 优秀 的 GC 算 
法 作为 一 大 卖点 。 

GC 性 能 在 语言 处 理 程序 的 性 能 评价 中 也 是 一 大 要 素 。 为 了 正确 评价 GC 的 性 能 ， 对 GC 
算法 的 理解 是 不 可 或 缺 的 。 


留意 内 存 空间 的 用 法 


应 该 有 不 少 人 是 通过 使 用 搭载 GC 的 编程 语言 来 学 习 编 程 的 吧 。 本 书 的 作者 之 一 中 村 也 
是 如 此 ， 他 最 初 接触 的 编程 语言 是 Java。 

可 以 说 在 用 Java 语言 编写 程序 时 完全 不 用 留意 内 存 空间 的 用 法 。 当 然 这 也 是 多 亏 了 
GC， 这 是 好 事 ， 但 太 不 留心 也 会 招致 麻烦 。 

例如 ， 有 时 会 出 现 无 意 中 把 内 存 空间 挥霍 一 空 的 情况 。 比 如 在 循环 中 生成 一 些 没 用 的 对 
象 等 。 
这 是 因为 没有 把 握 好 编程 语言 背后 的 内 存 管理 的 概念 。 

本 书 中 以 具体 的 编程 语言 为 例 ， 来 说 明 编 程 语言 中 所 使 用 的 内 存 空间 的 结构 ， 以 及 GC 
的 运行 。 通 过 阅读 本 书 ， 我 们 就 能 在 编程 中 留意 内 存 空间 的 用 法 了 。 
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序章 


不 会 过 时 的 技术 


GC 自 1960 年 发 布 以 来 ， 一 直 在 吸引 着 顶尖 工程 师 们 的 目光 。 笔 者 确信 ， 只 要 计算 机 构 
造 不 发 生根 本 性 的 改变 ，GC 就 是 一 门 不 会 过 时 的 技术 。 对 程序 员 来 说 ， 比 起 学 习 日 新 月 异 
的 最 新 技术 ， 学 习 GC 这 样 的 古典 技术 不 是 更 幸福 吗 ? 


更 何况 ，GC 很 有 趣 


说 实话 ， 其 实 笔者 自己 学 习 GC 的 时 候 ， 并 没有 想 过 上 述 这 些 略 复杂 的 事情 。 现 在 回 过 
头 觉得 学 了 GC 真 好 ， 也 只 是 因为 它 具备 前 面 那些 优点 而 已 。 

为 什么 当初 要 学 GC 呢 ? 对 笔者 而 言 ， 之 所 以 会 学 习 GC 的 算法 和 实现 ， 纯 粹 是 觉得 有 趣 。 

笔者 小 时 候 就 喜欢 拆 点 什么 东西 ， 看 看 里 面 是 怎样 的 。 电 视 机 、 收 音 机 、 红 白 机 什么 的 
都 拆 了 个 遍 。 平 时 也 喜欢 研究 那些 看 似 理所当然 地 在 运转 的 机 器 ， 看 看 它们 的 内 部 如 何 。 笔 
者 至 今 都 还 记得 看 到 其 内 部 时 的 快感 ， 以 及 了 解 其 构造 时 的 感动 。 

或 许 学 习 GC 也 差不多 是 这 样 。 对 笔者 来 说 ， 研 究 GC 这 种 理所当然 存在 的 东西 ， 看 看 
它 的 内 部 ， 这 是 一 件 非常 刺激 的 事 。 

本 书 中 饱含 了 笔者 在 看 到 GC 的 内 部 时 生出 的 “感动 "。 读 完 本 书后 ， 相 信 你 心中 的 疑 
“为 什么 要 学 GC?” 也 一 定 会 转化 成 感动 ， 发 自 内 心地 认为 “GC 真有 趣 ! ”。 
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本 书 由 两 部 分 构成 。 





1 
2. 实现 篇 


在 “算法 篇 ”中 ,我 们 没有 必要 去 详细 了 人 解 特定 的 编程 语言 ， 你 只 要 能 用 任何 一 种 语言 
编程 ， 就 能 往 下 读 “ 算 法 篇 ”。 

阅读 “实现 篇 ”需要 具备 C 和 C++ 的 知识 。 只 要 会 用 C 的 函数 指针 、C++ 的 模板 ， 阅 读 “ 实 
现 篇 ”就 没有 什么 障碍 。 关 于 GC 算法 的 知识 ， 读 完 本 书 的 “算法 篇 ”就 相当 够 用 了 。 

男 一 方面 ， 对 于 “实现 篇 ”中 涉及 的 各 种 编程 语言 ， 最 好 有 一 定 程度 的 了 解 ， 那样 阅读 
起 来 会 比较 轻松 。 关 于 本 书 涉及 的 编程 语言 ， 在 本 书 的 “附录 ”部 分 中 略 有 介绍 。 
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图 中 的 箭头 
本 书 的 插图 中 会 出 现 各 种 各 样 的 箭头 。 关 于 本 书 中 主要 使 用 的 箭头 ， 请 参考 图 1。 





(a) = 





(b) 





(9) > 


@) ee 


(e) 




















V 


图 1 箭头 的 样式 


箭头 (a) 表示 引用 关系 ， 用 于 从 根 到 对 象 的 引用 等 。 

箭头 (b) 表示 赋值 操作 和 转移 操作 ， 用 于 给 变量 赋值 、 复 制 对 象 、 转 移 对 象 等 。 
箭头 (c) 表示 处 理 流 程 ， 用 于 流程 图 和 函数 调用 等 。 

箭头 (d) 表示 时 间 的 经 过 。 

箭头 (e) 表示 继承 关系 ， 主 要 会 在 “实现 篇 ”的 类 图 中 出 现 。 


伪 代 码 

为 了 帮助 读者 理解 GC 算法 ， 本 书 采用 伪 代 码 进行 解说 。 关 于 用 到 的 伪 代 码 ， 本 书后 文 
中 会 对 其 表示 法 进行 说 明 。 

本 书 用 到 的 伪 代 码 ， 其 基本 语法 跟 一 般 编程 语言 很 像 。 因 此 读者 可 以 直观 地 理解 本 书 中 
出 现 的 众多 伪 代 码 。 


命名 规则 


变量 以 及 函数 都 用 小 写字 母 表 示 ( 例 : obj )。 和 常量 都 用 大 写字 母 表 示 ( 例 : COPIED)。 另 外 ， 
本 书 采 用 下 划 线 连接 两 个 及 两 个 以 上 的 单词 ( 例 : free_list、update_ptr()、HEAP_SIZE)。 


空 指 针 和 真 假 值 
设 真 值 为 TRUE， 假 值 为 FALSE。 拥 有 真 假 值 的 变量 var 的 否定 为 !var。 
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序章 
除 此 之 外 ， 本 书 用 NULL 表示 没有 指向 任何 地 址 的 指针 。 
函数 


本 书 采用 与 一 般 编程 语言 相同 的 描述 方法 来 定义 函数 。 人 例如， 我们 将 以 argl1、arg2 为 
参数 的 国 数 func() 定义 如 下 。 


1 | func(argl, arg2){ 
2 
3 | 二 
当 我 们 以 整数 100 和 200 为 实 参 调用 该 函数 时 ， 即 为 func (100,200)。 
缩 进 
我 们 将 缩 进 也 算 作 语 法 的 一 部 分 。 例 如 像 下 面 这 样 ， 用 缩 进 表 示 if 语句 的 作用 域 。 


if(test == TRUE) 


1 
3 
4 
5 


在 上 面 的 例子 中 ， 只 有 当 test 为 真 的 时 候 ， 才 会 执行 第 2 行 到 第 4 行 。 第 5 行 与 test 
的 值 没 有 关系 ， 所 以 一 定 会 被 执行 。 此 外 ， 我 们 把 缩 进 长 度 设 为 两 个 空格 。 
指针 

在 GC 算法 中 ， 指 针 是 不 可 或 缺 的 。 我 们 用 星 号 (*) 访 问 指针 所 引用 的 内 存 空 间 。 例 如 
我 们 把 指针 ptr 指向 的 对 象 表示 为 *ptr。 
域 

我 们 可 以 用 obj.field 访问 对 象 obj 的 域 field。 例 如 ， 我 们 要 想 在 对 象 girl 的 各 个 域 
name 、age、job 中 分 别 代入 值 ， 可 按 如 下 书写 。 


1 | girl.name = "Hanako" 
2| girl.age = 30 
3| girl.job = "lawyer" 


for 循环 
我 们 在 给 整数 增 量 的 时 候 使 用 for 循环 。 例 如 用 变量 sum 求 1 到 10 的 和 时 ， 代 码 如 下 所 示 。 
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1 
2 
3 


sum = 0 
for(i 1 110) 


sum += i 





for 循环 也 用 来 访问 数组 元 素 。 例 如 ， 想 把 函数 ao_something() 应 用 在 数组 array 中 包 
含 的 所 有 元 素 中 时 ， 我 们 可 以 用 for( 变量 : 集合 ) 的 形式 来 按 顺 序 访问 全 部 元 素 。 


1 
2 


for(obj : array) 





do_something(obj) 

















当然 ,也 可 以 像 下 面 这 样 把 index 作为 下 标 ( 整 数 是 数组 array 的 长 度 )。 和 C 语言 
编程 语言 一 样 ， 数 组 的 下 标 都 从 o 开始 。 


1 
2 





for(index : 0..(N-1)) 


do_something(array[index]) 





栈 与 队列 


GC 中 经 常用 到 栈 和 队列 等 数据 结构 。 栈 是 一 种 将 后 进入 的 数据 先 取出 的 数据 结构 ， 即 
FILO (First-In Last-Out)。 与 其 相反 ,队列 是 将 先进 入 的 数据 和 完 取 出 的 数据 结构 ， 即 FIFO 
(First-In First-Out )。 

我 们 分 别 用 push() 函数 和 pop() 函数 将 数据 压 栈 (push ) 和 出 栈 (pop )。 用 push (stack， 
obj) 向 栈 stack 中 压 人 对 象 obj。 用 pop(stack) 从 stack 中 取出 数据 ， 并 将 此 数据 作为 
返回 值 。 另 外 , 我们 用 is_full(stack) 检查 stack 是 否 为 满 ， 用 is_empty(stack) 检查 
stack 是 否 为 空 ， 并 返回 真 假 值 。 

另 一 方面 , 我 们 用 enqueue() 函数 和 dequeue() 函数 来 向 队列 内 添加 (enqueue) 以 
及 取出 (dequeue) 数 据 , 用 enqueue(queue，data) 来 向 队列 queue 中 添加 数据 data， 用 
dequeue (queue) 来 从 queue 取出 并 返回 数据 。 


特殊 的 函数 


除了 以 上 介绍 的 函数 之 外 ， 我 们 还 有 两 个 在 伪 代 码 中 出 现 的 特殊 函数 。 

首先 是 copy_data() 函数 ， 它 是 复制 内 存 区 域 的 函数 。 我 们 用 copy_data(ptr1，ptr2，size) 把 
size 个 字 节 的 数据 从 指针 ptr2 指向 的 内 存 区 域 复制 到 ptr1 指向 的 内 存 区 域 。 这 个 函数 跟 C 
语言 中 的 memcpy() 函数 用 法 相同 。 

swap() 函数 是 殖 换 两 个 变量 值 的 函数 。 我 们 用 swap (var1，var2) 来 替换 变量 varl 和 变 
量 var2 的 值 。 
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本 章 中 将 为 各 位 说 明 GC 中 的 基本 概念 。 





(和 对象/ 头 / 域 


对 象 这 个 词 ， 在 不 同 的 使 用 场合 其 意思 各 不 相同 。 比 如 ， 在 面向 对 象 编程 中 , 它 指 “ 具 
有 属性 和 行为 的 事物 ”， 然 而 在 GC 的 世界 中 ,对象 表示 的 是 “通过 应 用 程序 利用 的 数据 的 
集合 ” [e] 

对 象 配置 在 内 存 空间 里 。GC 根据 情况 将 配置 好 的 对 象 进行 移动 或 销毁 操作 。 因 此 ， 对 
象 是 GC 的 基本 单位 。 本 书 中 的 所 有 “对 象 ”都 表示 这 个 含义 。 

一 般 来 说 ， 对 象 由 头 (header) 和 域 field ) 构成 。 我 们 下 面 将 对 其 逐一 说 明 。 


1.1.1 头 
我 们 将 对 象 中 保存 对 象 本 身 信 息 的 部 分 称 为 “ 头 "”。 头 主要 含有 以 下 信息 。 
































。 对 象 的 大 小 
。 对 象 的 种 类 
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如 果 不 清 楚 对 象 的 大 小 和 种 类 ， 就 会 发 生 问题 ， 例 如 无 法 判别 内 存 中 存储 的 对 象 的 边界 。 
因此 头 对 GC 来 说 非常 重要 。 

此 外 ， 头 中 事先 存 有 运行 GC 所 需 的 信息 。 然 而 根据 GC 算法 的 不 同 ， 信 息 也 不 同 。 

比如 将 在 第 2 章 中 介绍 的 GC 标记 - 清除 算法 ， 就 是 在 对 象 的 头 部 中 设置 1 个 flag (标志 
位 ) 来 记录 对 象 是 否 已 标记 ， 从 而 管理 各 个 对 象 。 

因为 任何 GC 算法 中 都 会 用 到 对 象 大 小 和 种 类 的 信息 ， 所 以 本 书 就 不 专门 在 图 中 将 其 标 
记 出 来 了 。 另 一 方面 ,我们 会 将 标志 位 等 算法 特有 的 信息 作为 对 象 的 一 部 分 明确 写 出 。 











1.1.2 域 

我 们 把 对 象 使 用 者 在 对 象 中 可 访问 的 部 分 称 为 “ 域 "。 可 以 将 其 想 成 C 语言 中 结构 体 的 成 员 ， 
这 样 就 很 简单 了 吧 。 对 象 使 用 者 会 引用 或 替换 对 象 的 域 值 。 另 一 方面 ， 对 象 使 用 者 基本 上 无 
法 直接 更 改 头 的 信息 。 

域 中 的 数据 类 型 大 致 分 为 以 下 2 种 。 

。 指 针 

。 非 指针 





指针 是 指向 内 存 空 间 中 某 块 区 域 的 值 。 用 C 语言 和 C++ 语言 编程 过 的 读者 对 它 应 该 很 
熟悉 了 吧 。 即 使 是 像 Java 这 样 语言 使 用 者 没有 明确 用 到 指针 的 编程 语言 ， 语 言 处 理 程序 内 
部 也 用 到 了 指针 。 关 于 指针 ， 我 们 在 1.2 节 中 再 详细 介绍 。 

非 指 针 指 的 是 在 编程 中 直接 使 用 值 本 身 。 数 值 、 字 符 以 及 真 假 值 都 是 非 指针 。 

在 对 象 内 部 ， 头 之 后 存在 1 个 及 工 个 以 上 的 域 。 在 “算法 篇 " 中 ， 对 象 、 头 以 及 域 的 关 
系 如 图 1.1 所 示 。 





























对 象 





图 1.1 对 象 、 头 以 及 域 


为 了 更 简单 地 向 大 家 说 明 ， 我 们 事先 把 “算法 篇 ”中 域 的 大 小 全 设 成 1 个 字 ”。 











@ 字 是 计算 机 进行 数据 处 理 和 运算 的 单位 。 字 由 若干 字 节 构成 ， 字 的 位 数 叫 作 字 长 ,不 同 档次 的 机 器 有 不 同 的 字 长 。 
例如 一 台 8 位 机 的 字 长 为 8 位 ,一 台 16 位 机 的 字 长 为 16 位 。 
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此 外 在 伪 代 码 中 ,可 以 用 obj.fieldt、obj.field2……: 来 从 头 按 顺序 访问 对 象 obj 的 
各 个 域 。 


1.2 


通过 CC， 对 象 会 被 销毁 或 保留 。 这 时 候 起 到 关键 作用 的 就 是 指针 。 因 为 GC 是 根据 对 
象 的 指针 指向 去 搜寻 其 他 对 象 的 。 另 一 方面 ，GC 对 非 指针 不 进行 任何 操作 。 

在 这 里 有 两 点 需要 我 们 注意 。 

首先 ， 要 注意 语言 处 理 程序 是 否 能 判别 指针 和 非 指针 。 要 判别 指针 和 非 指 针 需 要 花费 一 
定 的 功夫 ， 关 于 这 一 点 我 们 会 在 第 6 章 详细 说 明 。 除 第 6 章 之 外 ， 在 “算法 篇 ”的 各 个 章节 中 ， 
我 们 都 以 GC 可 判别 对 象 各 域 中 的 值 是 指针 还 是 非 指针 为 前 提 进 行 解说 。 

男 一 点 是 指针 要 指向 对 象 的 哪个 部 分 。 指 针 如 果 指 向 对 象 首 地 址 以 外 的 部 分 ，GC 就 会 
变 得 非常 复杂 。 在 大 多 数 语言 处 理 程序 中 ， 指 针 都 默认 指向 对 象 的 首 地 址 。 因 为 存在 这 个 制 
约 条 件 ， 不 仅 是 CC， 就 连 语言 处 理 程序 的 其 他 各 种 处 理 都 变 得 简单 了 。 因 此 我 们 在 “算法 篇 ” 
中 也 以 此 条 件 为 前 提 。 

在 “算法 篇 ”中 ， 对 象 和 指针 的 关系 如 图 1.2 所 示 。 
















































































对 象 





图 1.2 对象 和 指针 





在 此 我 们 把 图 1.2 中 的 B 和 C 称 为 A 的 子 对 象 。 对 某 个 对 象 的 子 对 象 进行 某 项 处 理 是 GC 
的 基本 操作 。 在 “算法 篇 ”的 伪 代 码 部 分 ,我 们 用 children (obj) 获取 指向 对 象 obj 的 子 对 
象 的 指针 数组 。 使 用 这 个 children() 函数 ,我 们 可 以 把 遍历 子 对 象 的 操作 写 得 简单 一 些 。 
打 个 比方 ， 我 们 假设 执行 了 以 下 代码 来 处 理 图 1.2 的 情况 。 


1 |for(child : children(A)) 
2 func(*child) 


此 时 ， 对象 B、C 依次 作为 实 参 调用 func() 函数 。 





1.4 堆 


mutator 是 Edsger Dijkstra" | 琢磨 出 来 的 词 ， 有 “改变 某 物 ”的 意思 。 说 到 要 改变 什么 ， 那 
就 是 GC 对 象 间 的 引用 关系 。 不 过 光 这 么 说 可 能 大 家 还 是 不 能 理解 ， 其 实用 一 句 话 概括 的 话 ， 
它 的 实体 就 是 “应 用 程序 ”。 这 样 说 就 容易 理解 了 吧 。GC 就 是 在 这 个 mutator 内 部 精神 饱满 地 
工作 着 。 

mutator 实际 进行 的 操作 有 以 下 2 种 。 



























































。 生 成 对 象 
。 更 新 指针 


mutator 在 进行 这 些 操 作 时 ， 会 同时 为 应 用 程序 的 用 户 进行 一 些 处 理 ( 数 值 计算 、 浏 览 网 页 、 
编辑 文章 等 )。 随 着 这 些 处 理 的 逐步 推进 ， 对 象 间 的 引用 关系 也 会 “改变 "。 伴 随 这 些 变化 会 
产生 垃圾 ， 而 负责 回收 这 些 垃圾 的 机 制 就 是 GC。 


堆 指 的 是 用 于 动态 (也 就 是 执行 程序 时 ) 存 放 对 象 的 内 存 空间 。 当 mutator 申请 存放 对 象 时 ， 
所 需 的 内 存 空 间 就 会 从 这 个 堆 中 被 分 配给 mutator。 

GC 是 管理 堆 中 已 分 配对 象 的 机 制 。 在 开始 执行 mutator 前 ，GC 要 分 配 用 于 堆 的 内 存 空间 。 
一 旦 开始 执行 mutator， 程 序 就 会 按照 mutator 的 要 求 在 堆 中 存放 对 象 。 等 到 堆 被 对 象 占 满 后 ， 
GC 就 会 启动 ， 从 而 分 配 可 用 空间 。 如 果 不 能 分 配 足够 的 可 用 空间 ， 一 般 倩 况 下 我 们 就 要 扩大 堆 。 

然而 ， 为 了 让 读者 能 更 容易 理解 ,在 “算法 篇 " 中 我 们 把 堆 的 大 小 固定 为 常量 HEAP_ 
SIZE， 不 会 进行 扩大 。 此 外 ,我 们 把 $heap_start 定 为 指 回 堆 首 地 址 的 指针 ， 把 $heap_end 
定 为 指向 堆 末 尾 下 一 个 地 址 的 指针 。 也 就 是 说 ，$heap_end 等 于 $heap_start + HEAP_SIZE。 

此 外 ， 本 书 中 将 如 图 所 示 的 推 的 左 侧 设 为 内 存 的 低地 址 ， 右 侧 设 为 高 地 址 。 

HEAP_SIZE、$heap_start 和 $heap_end 的 关系 如 图 1.3 所 示 。 






























































堆 
HEAP SIZE 
S$heap_start $heap_end 


图 1.3 堆 
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| 中 习 活 动 对 象 / 非 活动 对 象 


我 们 将 分 配 到 内 存 空 间 中 的 对 象 中 那些 能 通过 mutator 引用 的 对 象 称 为 “活动 对 象 " 。 反 
过 来 ， 把 分 配 到 堆 中 那些 不 能 通过 程序 引用 的 对 象 称 为 “ 非 活 动 对 象 " 。 也 就 是 说 ， 不 能 通 
过 程序 引用 的 对 象 已 经 没有 人 搭理 了 ， 所 以 死 掉 了 。 和 死 掉 的 对 象 ( 即 非 活动 对 象 ) 我 们 就 称 为 “ 垃 
圾 


























7? 
o 





这 里 需要 大 家 注意 的 是 : 死 了 的 对 象 不 可 能 活 过 来 。 因 为 就 算 mutator 想 要 重新 引用 ( 复 
活 ) 已 经 死 掉 的 对 象 ， 我 们 也 没 法 通过 mutator 找到 它 了 。 

因此 ，GC 会 保留 活动 对 象 ， 销 毁 非 活动 对 象 。 当 销毁 非 活动 对 象 时 ， 其 原本 占据 的 内 
存 空间 会 得 到 解放 ， 供 下 一 个 要 分 配 的 新 对 象 使 用 。 





活动 对 象 活动 对 象 


图 1.4 活动 对 象 和 非 活动 对 象 


1.6 


分 配 (allocation ) 指 的 是 在 内 存 空 间 中 分 配对 象 。 当 mutator 需要 新 对 象 时 ， 就 会 向 分 配 
器 (allocator) 申请 一 个 大 小 合适 的 空间 。 分 配器 则 在 堆 的 可 用 空间 中 找寻 满足 要 求 的 空间 ， 
返回 给 mutatoro 

像 Java 和 Ruby 这 些 配 备 了 GC 的 编程 语言 在 生成 实例 时 ， 会 在 内 部 进行 分 配 。 另 一 方面 ， 
因为 C 语言 和 C++ 没有 配备 GCC， 所 以 程序 员 要 使 用 malloc() 函数 和 nev 运算 符 等 进行 手动 分 配 。 

然而 ， 当 堆 被 所 有 活动 对 象 占 满 时 ， 就 算 运行 GC 也 无 法 分 配 可 用 空间 。 这 时 候 我 们 有 
以 下 两 种 选择 。 





























1. 销毁 至 今 为止 的 所 有 计算 结果 ， 输 出 错误 信息 

2. 扩大 堆 ， 分 配 可 用 空间 

之 前 在 1.4 节 中 也 讲 过 , 为 了 让 本 书 的 “算法 篇 ”更 易 懂 ， 这 里 我 们 选择 第 1 个 选项 。 我 
们 将 在 伪 代 码 中 用 allocation_fail() 函数 进行 第 1 项 的 处 理 。 
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， 在 现实 的 执行 环境 中 选择 第 2 项 会 更 贴 合 实际 。 因 为 我 们 必须 尽 可 能 地 避免 因 内 
有 在 内 存 空间 大 小 没有 特殊 限制 的 情况 下 ， 应 该 扩大 堆 。 


分 块 (chunk ) 在 GC 的 世界 里 指 的 是 为 利用 对 象 而 事先 准备 出 来 的 空间 。 

初始 状态 下 ， 堆 被 一 个 大 的 分 块 所 占据 。 

然后 ， 程 序 会 根据 mutator 的 要 求 把 这 个 分 块 分 割 成 合适 的 大 小 ， 作 为 (活动 ) 对 象 使 用 。 
活动 对 象 不 久 后 会 转化 为 垃圾 被 回收 。 此 时 ， 这 部 分 被 回收 的 内 存 空间 再 次 成 为 分 块 ， 为 下 次 
被 利用 做 准备 。 也 就 是 说 ， 内 存 里 的 各 个 区 块 都 重复 着 分 块 一 活动 对 象 一 垃圾 ( 非 活动 对 象 ) 一 
分 块 一 …… 这样 的 过 程 。 


根 (root) 这 个 词 的 意思 是 “根基 *“ 根 底 ”。 在 GC 的 世界 里 ， 根 是 指向 对 象 的 指针 的 “起 点 ” 
部 分 。 
这 些 都 是 能 通过 mutator 直接 引用 的 空间 。 举 个 例子 ， 请 看 下 面 的 伪 代 码 。 

































































1 | $obj = Object.new 
2 | $obj.field1 = Object.new 




















在 这 里 $obj 是 全 局 变量 。 首 先 ， 我 们 在 第 1 行 分 配 一 个 对 象 (对 象 A)， 然 后 把 $obj 代 
入 指向 这 个 对 象 的 指针 。 在 第 2 行 我 们 也 分 配 一 个 对 象 ( 对 象 B)， 然 后 把 $obj .fieldl 代入 
指向 这 个 对 象 的 指针 。 在 执行 完 第 2 行 后 ， 全 局 变量 空间 及 堆 如 图 1.5 所 示 。 











图 1.5 全 局 变量 空间 及 堆 的 示意 图 
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在 这 里 我 们 可 以 使 用 $obj 直接 从 伪 代 码 中 引用 对 象 A， 也 就 是 说 A 是 活动 对 象 。 此 外 ， 
因为 可 以 通过 $obj 经 由 对 象 A 引用 对 象 B， 所 以 对 象 B 也 是 活动 对 象 。 因 此 GC 必须 保护 
这 些 对 象 。 

GC 把 上 述 这 样 可 以 直接 或 间接 从 全 局 变量 空间 中 引用 的 对 象 视 为 活动 对 象 。 

与 全 局 变量 空间 相同 ， 我 们 也 可 以 通过 mutator 直接 引用 调用 栈 (call stack ) 和 寄存 需 
也 就 是 说 ， 调 用 栈 、 寄 存 器 以 及 全 局 变量 空间 都 是 根 。 

但 在 这 里 我 们 必须 注意 一 点 ， 那 就 是 GC 在 一 般 情况 下 无 法 严谨 地 判断 寄存 器 和 调用 栈 
中 的 值 是 指针 还 是 非 指针 。 关 于 这 一 点 会 在 第 6 章 详细 说 明 。 为 了 判断 根 中 的 指针 ， 我 们 需 
要 下 点 功夫 。 

在 这 里 介绍 怎么 去 判断 未 免 太 费 口 舌 。 所 以 在 “算法 篇 "， 我们 先 暂 定 “GC 可 以 严 间 判 
断根 中 的 指针 和 非 指针 ”。 这 跟 1.2 节 的 前 提 相 同 。 

在 “算法 篇 ”中 ， 根 如 图 1.6 所 示 。 


























































































































图 1.6 根 和 堆 里 的 对 象 








此 外 , 我 们 将 伪 代 码 中 有 根 的 指针 数组 表示 为 $roots。 也 就 是 说 , 像 下 面 这 样 编写 
就 能 依次 把 所 有 由 根 引用 的 对 象 作 为 func() 函数 的 参数 。 


1 |for(r : $roots) 


2 func(*r) 
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1 已 怖 评价 标准 
评价 GC 算法 的 性 能 时 ， 我 们 采用 以 下 4 个 标准 。 
. 吞吐 量 
。 最 大 暂停 时 间 
。 堆 使 用 效率 
。 访 问 的 局 部 性 
下 面 我 们 逐一 进行 说 明 。 
1.9.1 ”吞吐 量 
从 一 般 意 义 上 来 讲 ， 否 吐 量 (throughput) 指 的 是 “在 单位 时 间 内 的 处 理 能 力 ” ,这 点 在 
GC 的 世界 中 也 不 例外 。 
请 参照 图 1.7 的 示例 。 


开始 执行 
mutator 











mutator 上 >------ > 和 > SEE 
GC --------- > ------ 一 一 一 >-----1 cr- 一 一 >>---------------- 
一 < 
A B 


1.7 mutator 和 GC 的 执行 示意 图 


在 mutator 整个 执行 过 程 中 ，GC 一 共 启 动 了 3 次 ， 我们 把 花费 的 时 间 分 别 设 为 A、B、C。 
也 就 是 说 ，GC 总 共 花 费 的 时 间 为 (A 十 B 十 C)。 男 一 方面 ,我 们 前 面 提 到 过 ， 以 GC 为 对 象 
的 堆 大 小 是 HEAP_SITZE。 也 就 是 说 ， 在 大 小 为 HEAP_SIZE 的 堆 进 行内 存 管理 ， 要 花费 的 时 长 
为 (A 十 B 十 C)。 因 此， 这 种 情况 下 GC 的 吞吐 量 为 HEFAP_SIZE/(A 十 B 十 C)。 

当然 ， 人们 通常 都 喜欢 吞吐 量 高 的 GC 算法 。 然 而 判断 各 算法 吞吐 量 的 好 坏 时 不 能 一 概 
而 论 。 

打 个 比方 ， 众 所 周知 GC 复制 算法 和 GC 标记 - 清除 算法 相 比 ， 活 动 对象 越 少 吞吐 量 越 高 。 
这 是 因为 GC 复制 算法 只 检查 活动 对 象 ， 而 GC 标记 - 清除 算法 则 会 检查 所 有 的 活动 和 非 活 
动 对 象 。 

然而 ， 随 着 活动 对 象 的 增多 ,各 GC 算法 表现 出 的 吞吐 量 也 会 相应 地 变化 。 极 端 情况 下 ， 
甚至 会 出 现 GC 标记 - 清除 算法 比 GC 复制 算法 表现 的 吞吐 量 更 高 的 情况 。 
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也 就 是 说 ， 即 便 是 同一 GC 算法 ， 其 吞吐 量 也 是 受 mutator 的 动作 左右 的 。 评 价 GC 算法 
的 吞吐 量 时 ， 有 必要 把 mutator 的 动作 也 考虑 在 内 。 


1.9.2 ”最 大 暂停 时 间 


本 书 “ 算 法 篇 ”中 介绍 的 所 有 GC 算法 ， 都 会 在 GC 执行 过 程 中 令 mutator 暂停 执行 。 最 
大 暂停 时 间 指 的 是 “ 因 执 行 GC 而 暂停 执行 mutator 的 最 长 时 间 ”。 这 么 说 可 能 比较 难 理解 ， 
请 再 看 一 遍 图 1.7。 最 大 暂停 时 间 是 A ~ C 的 最 大 值 ， 也 就 是 B。 

那么 ， 我 们 在 何 种 情况 下 需要 重视 此 种 指标 呢 ? 

典型 例子 是 两 足 步 行 的 机 器 人 。 如 果 在 其 步行 过 程 中 启动 GC， 我们 对 机 器 人 的 控制 就 
会 暂时 中 断 ， 直 到 GC 执行 完毕 方 可 重启 。 也 就 是 说 ， 在 这 期 间 机 器 人 完全 不 能 运作 。 很 显然 ， 
机 器 人 会 摔 倒 。 

再 举 个 例子 ，Web 浏览 器 会 如 何 呢 ? 如 果 在 浏览 Web 网 页 的 时 候 发 生 GC， 浏 览 器 就 会 
看 似 卡 住 ， 带 给 用 户 心 理 负担 。 像 Web 浏览 器 这 样 的 GUI 应 用 ， 大 多 数 都 是 以 人 机 交互 为 
前 提 的 ， 所 以 我 们 不 希望 执行 过 程 中 长 时 间 受 到 GC 的 影响 。 

这 种 情况 下 就 需要 缩短 最 大 暂停 时 间 。 然 而 不 管 尝试 哪 种 GC 算法 ， 我 们 都 会 发 现 较 大 
的 吞吐 量 和 较 短 的 最 大 暂停 时 间 不 可 兼 得 。 所 以 应 根据 执行 的 应 用 所 重视 的 指标 的 不 同 ,， 来 
分 别 采 用 不 同 的 GC 算法 。 


1.9.3 ” 堆 使 用 效率 


根据 GC 算法 的 差异 ， 堆 使 用 效率 也 大 相 径 庭 。 左 右 堆 使 用 效率 的 因素 有 两 个 。 

一 个 是 头 的 大 小 ， 男 一 个 是 堆 的 用 法 。 

首先 是 头 的 大 小 。 在 堆 中 堆放 的 信息 越 多 ，GC 的 效率 也 就 越 高 ， 否 吐 量 也 就 随 之 得 到 改善 。 
但 毋庸 置疑 ， 头 越 小 越 好 。 因 此 为 了 执行 G6C， 需 要 把 在 头 中 堆放 的 信息 控制 在 最 小 限度 。 

其 次 ,根据 堆 的 用 法 ， 堆 使 用 效率 也 会 出 现 巨 大 的 差异 。 举 个 例子 ，GC 复制 算法 中 将 
堆 二 等 分 ,每 次 只 使 用 一 半 ， 交 蔡 进 行 ， 因 此 总 是 只 能 利用 堆 的 一 半 。 相 对 而 言 ，GC 标记 - 
清除 算法 和 引用 计数 法 就 能 利用 整个 堆 。 

撤 开 这 个 不 说 ， 因 为 GC 是 目 动 内 存 管 理 功能 ， 所 以 过 量 占 用 堆 就 成 了 本 末 倒 置 。 与 春 
吐 量 和 最 大 暂停 时 间 一 样 ， 堆 使 用 效率 也 是 GC 算法 的 重要 评价 指标 之 一 。 

然而 ， 堆 使 用 效率 和 吞吐 量 ， 以 及 最 大 和 暂停 时 间 不 可 兼 得 。 简 单 地 说 就 是 : 可 用 的 堆 越 
大 ，GC 运行 越 快 ;相反 ， 越 想 有 效 地 利用 有 限 的 堆 ，GC 花费 的 时 间 就 越 长 。 


1.9.4 ”访问 的 局 部 性 


PC 上 有 4 种 存储 器 ， 分 别 是 寄存 器 、 缓 存 、 内 存 、 辅 助 存储 器 。 它 们 之 间 有 着 如 图 1.8 
所 示 的 层级 关系 。 


































































































































































































1.9 评价 标准 





内 存 ( 主 存储 器 ) 
y 辅助 存储 器 (硬盘 等 ) 
大 容量 低速 


图 1.8 存储 器 的 层级 构造 























众所周知 ， 越 是 可 实现 高 速 存 取 的 存储 器 容量 就 越 小 。 毫 无 疑问 ， 我 们 都 希望 尽 可 能 地 
利用 较 高 速 的 存储 器 ， 但 由 于 高 速 的 存储 器 容量 小 ， 因 此 通常 不 可 能 把 所 有 要 利用 的 数据 都 
放 在 寄存 器 和 缓存 里 。 一 般 我 们 会 把 所 有 的 数据 都 放 在 内 存 里 ， 当 CPU 访问 数据 时 ， 仅 把 
要 使 用 的 数据 从 内 存 读 取 到 缓存 。 与 此 同时 ,我 们 还 将 它 附 近 的 所 有 数据 都 读 取 到 缓存 中 ， 
从 而 压缩 读 取 数据 所 需要 的 时 间 。 

男 一 方面 ， 具有 引用 关系 的 对 象 之 间 通 常 很 可 能 存在 连续 访问 的 情况 。 这 在 多 数 程序 中 
都 很 常见 ， 称 为 “访问 的 局 部 性 ”。 考 虑 到 访问 的 局 部 性 ， 把 具有 引用 关系 的 对 象 安排 在 堆 
中 较 近 的 位 置 ， 就 能 提高 在 缓存 中 读 取 到 想 利用 的 数据 的 概率 ， 令 mutator 高 速 运 行 。 想 深 
入 了 解 访问 的 局 部 性 的 读者 ， 请 参考 《计算 机 组 成 与 设计 : 人 硬件、 软件 接口 》™1。 

有 些 GC 算法 会 根据 引用 关系 重 排 对 象 ， 例 如 在 第 4 章 中 提 到 的 GC 复制 算法 等 。 
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GC 标记 一 清除 算法 





世界 上 首 个 值得 纪念 的 GC 算法 是 GC 标记 - 清除 算法 (Mark Sweep GC)"。 自 其 
问世 以 来 ， 一 直到 半 个 世纪 后 的 今天 ， 它 依然 是 各 种 处 理 程序 所 用 的 伟大 的 算法 。 





7 各 痢 什么 是 GC 标记 一 清除 算法 


就 如 它 的 字面 意思 一 样 ，GC 标记 - 清除 算法 由 标记 阶段 和 清除 阶段 构成 。 标 记 阶 段 是 
把 所 有 活动 对 象 都 做 上 标记 的 阶段 。 清 除 阶段 是 把 那些 没有 标记 的 对 象 ， 也 就 是 非 活动 对 象 
回收 的 阶段 。 通 过 这 两 个 阶段 ， 就 可 以 令 不 能 利用 的 内 存 空间 重新 得 到 利用 。 首 先 ， 标记 - 
清除 算法 的 伪 代 码 如 代码 清单 2.1 所 示 。 


代码 清单 2.1: mark_sweep() 函数 
1 | mark_sweep(){ 


























2 mark_phase() 
3 sweep_phase() 
4|} 


确实 分 成 了 标记 阶段 和 清除 阶段 。 接 下 来 我 们 就 对 各 个 阶段 进行 说 明 。 
在 之 后 的 说 明 中 ， 我 们 都 以 对 图 2.1 中 的 堆 执 行 GC 为 前 提 。 





2.1 什么 是 GC 标记 -清除 算法 


| | 对 象 
| | 分 类 








NULL 


空闲 链表 


2.1 执行 GC 前 堆 的 状态 


2.1.1 ”标记 阶段 
我 们 用 mark_phase() 函数 来 进行 标记 阶段 的 处 理 。 


代码 清单 2.2: mark_phase() 函数 
1 | mark_phase(){ 
2 for(T : $roots) 
3 mark(*r) 
4|} 


非常 简单 明了 吧 。 在 标记 阶段 中 ，collector 会 为 堆 里 的 所 有 活动 对 象 打上 标记 。 为 此 ， 
我 们 首先 要 标记 通过 根 直 接 引 用 的 对 象 。 这 里 的 “对 象 ” 就 是 我 们 在 1.8 节 中 讲 到 的 “确实 
活动 着 的 对 象 " 。 首 先 我 们 标记 这 样 的 对 象 ， 然 后 递归 地 标记 通过 指针 数组 能 访问 到 的 对 象 。 
这 样 就 能 把 所 有 活动 对 象 都 标记 上 了 。 

第 3 行 出 现 的 mark() 函数 的 定义 如 代码 清单 2.3 所 示 。 












































代码 清单 2.3: mark() 函数 
1 | mark(obj){ 
2 if(obj.mark == FALSE) 
3 obj.mark = TRUE 
4 for(child : children(obj)) 
5 mark(*child) 
6 
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在 第 2 行 中 ,检查 作 为 实 参 传递 的 obj 是 否 已 被 标记 。 在 引用 中 包含 了 循环 等 的 情况 下 ， 
即使 对 已 被 标记 的 对 象 ， 有 时 程序 也 会 调用 mark() 函数 。 出 现 类 似 这 种 情况 的 时 候 ， 我 们 





就 要 避免 重复 进行 标记 处 理 。 


如 果 标 记 未 完成 ， 则 程序 会 在 对 象 的 头 部 进行 置 位 操作 。 这 个 位 要 分 配 在 对 象 的 头 之 中 ， 
并 且 能 用 obj .mark 访问 。 意 思 是 大 obj .mark 为 真 ， 则 表示 对 象 已 标记 ; 若 obj .mark 为 假 ， 











则 对 象 没 有 被 标记 。 














obj.mark = TRUE 








图 2.2 设置 标志 位 的 处 理 





标记 完 所 有 活动 对 象 后， 标记 阶段 就 结束 了 。 标 记 阶 段 结束 时 的 堆 如 图 2.3 所 示 。 


国 | x 多 
| 分 类 











| 一 一 
别 古 
堆 
pt NULL 
空闲 链表 


2.3 ”标记 阶段 结束 后 的 堆 状态 








在 标记 阶段 中 ， 程 序 会 标记 所 有 活动 对 象 。 毫 无 疑问 ， 标 记 所 花费 的 时 间 是 与 “活动 对 


象 的 总 数 ” 成 正比 的 。 








以 上 是 关于 标记 阶段 的 说 明 。 用 一 句 话 概 括 ， 标 记 阶 段 就 是 “遍历 对 象 并 标记 ”的 处 理 
过 程 。 这 个 “遍历 对 象 ”的 处理 过 程 在 GC 中 是 一 个 非常 重要 的 概念 ,在 之 后 还 会 多 次 出 现 ， 





请 务必 记 牢 。 
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深度 优先 搜索 与 广度 优先 搜索 
我 们 在 搜索 对 象 并 进行 标记 时 使 用 的 是 深度 优先 搜索 (depth-first search )。 这 是 尽 可 能 从 深 
度 上 搜索 树 形 结构 的 方法 。 








男 回 已 存储 的 对 象 


图 2.4 深度 优先 搜索 














另 一 方面 ， 还 有 广度 优先 搜索 (breadth -first search ) 方 法 。 这 是 尽 可 能 从 广度 上 搜索 树 形 
结构 的 方法 。 











于 


国 呈 加 呈 加 量 加 呈 加 呈 国 国 
人 | | 大 fo 对 多 


图 2.5 广度 优先 搜索 
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顺便 说 一 下 ， 图 2.4 和 图 2.5 中 各 对 象 旁 边 的 号 码 表 示 搜 索 顺 序 。 

GC 会 搜索 所 有 对 象 。 不 管 使 用 什么 搜索 方法 ， 搜 索 相 关 的 步骤 数 ( 调 查 的 对 象 数 量 ) 都 不 会 
有 差别 。 

另 一 方面 ， 比 较 一 下 内 存 使 用 量 ( 已 存储 的 对 象 数量 ) 就 可 以 知道 ， 深 度 优先 搜索 比 广度 优先 
搜索 更 能 压低 内 存 使 用 量 。 因 此 我 们 在 标记 阶段 经 常用 到 深度 优先 搜索 。 























































































































2.1.2 ”清除 阶段 
在 清除 阶段 中 ，collector 会 遍历 整个 堆 ， 回 收 没有 打上 标记 的 对 象 ( 即 垃圾 )， 使 其 能 再 
次 得 到 利用 。 


代码 清单 2.4: sweep_phase() 函数 
sweep_phase(){ 


上 


sweeping = $heap_start 
while(sweeping < $heap_end) 
if(sweeping.mark == TRUE) 
sweeping.mark = FALSE 
else 
sweeping.next = $free_list 


$free_list = sweeping 


Oi oO 0 WwW Nb 


sweeping += sweeping.size 





je 
© 


} 

















在 此 出 现 了 叫 作 size 的 域 ， 这 是 存储 对 象 大 小 ( 字 节 数 ) 的 域 。 跟 mark 域 一 样 ， 我 们 
事先 在 各 对 象 的 头 中 定义 它们 。 

在 清除 阶段 ， 我 们 使 用 变量 sweeping 遍历 堆 ， 具 体 来 说 就 是 从 堆 首 地 址 $heap_start 
开始 ， 按 顺序 一 个 个 遍历 对 象 的 标志 位 。 

设置 了 标志 位 ， 就 说 明 这 个 对 象 是 活动 对 象 。 活 动 对 象 必 然 是 不 能 回收 的 。 在 第 5 行 我 
们 取消 标志 位 ， 准 备 下 一 次 的 GC。 

我 们 必须 把 非 活 动 对 象 回收 再 利用 。 回 收 对 象 就 是 把 对 象 作 为 分 块 ， 连 接 到 被 称 为 “ 空 
闲 链表 ”的 单 向 链表 。 在 之 后 进行 分 配 时 只 要 遍历 这 个 空闲 链表 ， 就 可 以 找到 分 块 了 。 

我 们 在 sweep_phase() 函数 的 第 7 行 、 第 8 行进 行 这 项 操作 。 

在 第 7 行 新 出 现 了 叫 作 next 的 域 。 我 们 只 在 生成 空闲 链表 以 及 从 这 个 空闲 链表 中 取出 分 
块 时 才 会 使 用 到 它 。 没 有 必要 为 各 个 对 象 特别 准备 域 ， 从 对 和 象 已 有 的 域 之 中 分 出 来 一 个 就 够 了 。 
在 本 章 中 ，next 表示 对 象 (或 者 分 块 ) 最 初 的 域 ， 即 fielda1。 也 就 是 说 ， 给 field1 这 个 域 起 
个 别名 叫 next。 这 跟 C 语言 中 的 联合 体 (union ) 的 概念 相同 。 
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这 里 要 注意 的 是 在 第 7 行 重 写 sweeping 的 域 这 一 步 。 读 者 可 能 会 有 疑问 :“GC 重 写 了 
对 象 的 域 也 没事 吗 ? ”因为 我 们 知道 这 个 对 象 已 经 死 了 ， 所 以 事实 上 没有 任何 问题 。 























2.6 清除 阶段 结束 后 的 堆 状 态 





在 清除 阶段 ， 程 序 会 遍历 所 有 堆 ， 进 行 垃圾 回收 。 也 就 是 说 ， 所 花费 时 间 与 堆 大 小 成 正 
比 。 堆 越 大 ， 清 除 阶段 所 花费 的 时 间 就 会 越 长 。 
以 上 是 对 标记 阶段 以 及 清除 阶段 的 大 体 说 明 。 不 过 还 有 几 件 事情 必须 事先 说 一 下 。 


2.1.3 分配 


接 下 来 为 大 家 讲解 分 配 的 相关 内 容 。 这 里 的 分 配 是 指 将 回收 的 垃圾 进行 再 利用 。 那 么 ， 
分 配 是 怎样 进行 的 呢 ? 也 就 是 说 ， 当 mutator 申请 分 块 时 ， 怎 样 才能 把 大 小 合适 的 分 块 分 配 
给 mutator 呢 ? 

如 前 文 所 述 ， 我 们 在 清除 阶段 已 经 把 垃圾 对 象 连接 到 空闲 链表 了 。 搜 索 空 闲 链表 并 寻找 
大 小 合适 的 分 块 ， 这 项 操作 就 叫 作 分 配 。 执 行 分 配 的 函数 new_obj () 如 代码 清单 2.5 所 示 。 



























































代码 清单 2.5: new_obj() 函数 


new_obj(size){ 


请 


chunk = pickup_chunk(size, $free_list) 
if(chunk != NULL) 

return chunk 
else 


allocation_fail() 


OW DD 
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第 2 行 的 pickup_chunk() 范 数 用 于 遍历 $free_list， 寻 找 大 于 等 于 size 的 分 块 。 它 
不 光 会 返回 和 size 大 小 相同 的 分 块 ， 还 会 返回 比 size 大 的 分 块 。 如 果 它 找到 和 size 大 小 
相同 的 分 块 ， 则 会 直接 返回 该 分 块 ; 如 果 它 找到 比 size 大 的 分 块 ， 则 会 将 其 分 割 成 size 大 
小 的 分 块 和 去 掉 size 后 剩余 大 小 的 分 块 ， 并 把 剩余 的 分 块 返回 空闲 链表 。 

如 果 此 函数 没有 找到 合适 的 分 块 ， 则 会 返回 NULL。 返 回 NULL 时 分 配 是 不 会 进行 的 。 为 
了 处 理 这 种 情况 ， 我 们 在 代码 清单 2.5 中 调用 了 之 前 在 1.6 节 提 到 的 allocation_fail() 函数 。 


@@ 


First-fit、Best-fit、Worst -fit 的 不 同 
之 前 我 们 讲 的 分 配 策略 叫 作 First- 作 。 因 为 在 pickup_chunk() 函数 中 ， 最 初 发 现 大 于 等 于 
size 的 分 块 时 就 会 立即 返回 该 分 块 。 
然而 ,分配 策略 不 止 这 些 。 还 有 遍历 空 闻 链表 ， 返 回 大 于 等 于 size 的 最 小 分 块 ， 这 种 策略 叫 
作 Best-fit。 
还 有 一 种 策略 叫 作 Worst- 优 ， 即 找 出 空闲 链表 中 最 大 的 分 块 ， 将 其 分 割 成 mutator 申请 的 
大 小 和 分 割 后 剩余 的 大 小 ， 目 的 是 将 分 割 后 剩余 的 分 块 最 大 化 。 但 因为 Worst-fit 很 容易 生成 大 
量 小 的 分 块 ， 所 以 不 推荐 大 家 使 用 此 方法 。 
除去 Worst- 优 ， 剩 下 的 还 有 Best-ft 和 First-fit 这 两 种 。 当 我 们 使 用 单纯 的 空闲 链表 时 ， 
考虑 到 分 配 所 需 的 时 间 ， 选 择 使 用 First-fit 更 为 明智 。 
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2.1.4 “合并 


前 文中 已 经 提 过 ， 根 据 分 配 策略 的 不 同 可 能 会 产生 大 量 的 小 分 块 。 但 如 果 它 们 是 连续 的 ， 
我 们 就 能 把 所 有 的 小 分 块 连 在 一 起 形成 一 个 大 分 块 。 这 种 “连接 连续 分 块 ” 的 操作 就 叫 作 合 
并 (coalescing)， 合 并 是 在 清除 阶段 进行 的 。 

执行 合并 的 函数 sweep_phase() 如 代码 清单 2.6 所 示 。 


代码 清单 2.6: 执行 合并 的 sweep_phase() 函数 
sweep_phase (){ 























上 


sweeping = $heap_start 
while(sweeping < $heap_end) 
if(sweeping.mark == TRUE) 
sweeping.mark = FALSE 
else 
if(sweeping == $free_list + $free_list.size) 


$free_list.size += sweeping.size 


OO OO DD 


else 





2.3 ”缺点 
10 sweeping.next = $free_list 
14 $free_list = sweeping 
12 sweeping += sweeping.size 
13 | } 


代码 清单 2.6 的 sweep_phase() 函数 只 有 第 7 行 、 第 8 行 与 代码 清单 2.4 不 同 。 第 7 行 用 
于 调查 这 次 发 现 的 分 块 和 上 次 发 现 的 分 块 是 否 连 续 ， 如 果 发 现 分 块 连续 ， 则 在 第 8 行将 邻接 
的 2 个 分 块 合并 ， 整 理 成 1 个 分 块 。 
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2.2.1 ”实现 简单 


说 到 GC 标记 - 清除 算法 的 优点 ， 那 当然 要 数 算法 简单 ， 实 现 容 易 了 。 

打 个 比方 ， 接 下 来 我 们 将 在 第 3 章 中 提 到 引用 计数 法 ， 在 引用 计数 法 中 就 很 难 切 实 管理 
计数 融 的 增 减 ， 实 现 也 很 困难 。 

另外 ， 如 果 算 法 实现 简单 ,那么 它 与 其 他 算法 的 组 合 也 就 相应 地 简单 。 在 第 3 章 和 第 4 
章 中 ， 我们 会 为 大 家 介绍 把 GC 标记 - 清除 算法 与 其 他 GC 算法 相 结合 的 方法 。 


2.2.2 ”与 保守 式 GC 算 法 兼容 


在 第 6 章 中 介绍 的 保守 式 GC 算法 中 ， 对 象 是 不 能 被 移动 的 。 因 此 保守 式 GC 算法 跟 把 
对 象 从 现在 的 场所 复制 到 其 他 场所 的 GC 复制 算法 (第 4 章 ) 与 标记 -压缩 算法 (第 $ 章 ) 不 
兼容 。 

而 GC 标记 - 清除 算法 因为 不 会 移动 对 象 ， 所 以 非常 适合 搭配 保守 式 GC 算法 。 事 实 上 ， 
在 很 多 采用 保守 式 GC 算法 的 处 理 程序 中 也 用 到 了 GC 标记 - 清除 算法 。 


2.3 


2.3.1 ”碎片 化 


在 GC 标记 - 清除 算法 的 使 用 过 程 中 会 逐渐 产生 被 细 化 的 分 块 ， 不 和 久 后 就 会 导致 无 数 的 
小 分 块 散布 在 堆 的 各 处 。 我 们 称 这 种 状况 为 碎片 化 (fragmentation )。 众 所 周知 ，Windows 的 
文件 系统 也 会 产生 这 种 现象 。 
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请 给 我 3 个 








(我 只 有 2 个 字 的 分 块 ! 】 





空闲 链表 
2.7 碎片 化 


如 果 发 生 碎片 化 ， 那 么 即使 堆 中 分 块 的 总 大 小 够 用 ， 也 会 因为 一 个 个 的 分 块 都 太 小 而 不 
能 执行 分 配 。 

此 外 ， 如 果 发 生 碎 片 化 ， 就 会 增加 mutator 的 执行 负担 。 如 1.9.4 节 中 所 述 ， 把 具有 引用 
关系 的 对 象 安排 在 堆 中 较 远 的 位 置 ， 就 会 增加 访问 所 需 的 时 间 。 

因为 分 块 在 堆 中 的 分 布 情况 取决 于 mutator 的 运行 情况 ， 所 以 只 要 使 用 GC 标记 - 清除 
算法 ， 就 会 或 多 或 少 地 产生 碎片 化 。 

为 了 避免 碎片 化 ， 可 以 采用 将 在 第 4 章 以 及 第 5$ 章 中 介绍 的 “压缩 *"， 以 及 在 本 章 介 绍 
的 “BiBOP 法 ”。 


2.3.2 ”分 配 速度 


GC 标记 - 清除 算法 中 分 块 不 是 连续 的 ， 因 此 每 次 分 配 都 必须 遍历 空闲 链表 ， 找 到 足够 
大 的 分 块 。 最 糟 的 情况 就 是 每 次 进行 分 配 都 得 把 空闲 链表 遍历 到 最 后 。 

另 一 方面 ， 因 为 在 GC 复制 算法 和 GC 标记 - 压缩 算法 中 ， 分 块 是 作为 一 个 连续 的 内 存 
空间 存在 的 ， 所 以 没 必 要 遍历 空闲 链表 ， 分 配 就 能 非常 高 速 地 进行 ， 而 且 还 能 在 堆 允 许 范 围 
内 分 配 很 大 的 对 象 。 

本 章 在 后 面 叙述 的 多 个 空闲 链表 (multiple free-list) 和 BiBOP 法 都 是 为 了 能 在 CC 标记 - 
清除 算法 中 高 速 进 行 分 配 而 想 出 的 方法 。 


2.3.3 “与 写 时 复制 技术 不 兼容 


写 时 复制 技术 (copy-on-write) 是 在 Linux 等 众多 UNIX 操作 系统 的 虚拟 存储 中 用 到 的 高 速 
化 方法 。 打 个 比方 , 在 Linux 中 复制 进程 ， 也 就 是 使 用 fork() 函数 时 ， 大 部 分 内 存 空间 都 
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不 会 被 复制 。 只 是 复制 进程 ， 就 复制 了 所 有 内 存 空间 的 话 也 太 说 不 过 去 了 吧 。 因 此 ， 写 时 复 
制 技术 只 是 装 作 已 经 复制 了 内 存 空间 ， 实 际 上 是 将 内 存 空间 共享 了 。 

在 各 个 进程 中 访问 数据 时 ， 能 够 访问 共享 内 存 就 没什么 问题 了 。 

然而 ， 当 我 们 对 共享 内 存 空间 进行 写 和 人 时， 不 能 直接 重 写 共享 内 存 。 因 为 从 其 他 程序 访 
问 时 ， 会 发 生 数 据 不 一 致 的 情况 。 在 重 写 时 ， 要 复制 自己 私有 空间 的 数据 ， 对 这 个 私有 空间 
进行 重 写 。 复 制 后 只 访问 这 个 私有 空间 ， 不 访问 共享 内 存 。 像 这 样 ， 因 为 这 门 技术 是 “在 写 
入 时 进行 复制 ” 的 ， 所 以 才 被 称 为 写 时 复制 技术 。 

这 样 的 话 ，GC 标记 - 清除 算法 就 会 存在 一 个 问题 一 一 与 写 时 复制 技术 不 兼容 。 即 使 没 
重 写 对 象 ，GC 也 会 设置 所 有 活动 对 象 的 标志 位 ， 这 样 就 会 频 款 发 生 本 不 应 该 发 生 的 复制 ， 
压迫 到 内 存 空 间 。 

为 了 处 理 这 个 问题 ， 我 们 采用 位 图 标记 (bitmap marking ) 的 方法 。 关 于 这 个 方法 ， 将 在 2.6 
节 中 介绍 。 
































”下角 多 个 空闲 链表 


之 前 我 们 讲 的 标记 - 清除 算法 中 只 用 到 了 一 个 空闲 链表 ， 在 这 个 空闲 链表 中 ， 对 大 的 分 
块 和 小 的 分 块 进行 同样 的 处 理 。 但 是 这 样 一 来 ， 每 次 分 配 的 时 候 都 要 遍历 一 次 空闲 链表 来 寻 
找 合 适 大 小 的 分 块 ， 这 样 非常 浪费 时 间 。 

因此 ， 我 们 有 一 种 方法 ， 就 是 利用 分 块 大 小 不 同 的 空闲 链表 ， 即 创建 只 连接 大 分 块 的 空 
闲 链表 和 只 连接 小 分 块 的 空 亲 链表。 这样 一 来 ， 只 要 按照 mutator 所 申请 的 分 块 大 小 选择 空 
闲 链表 ， 就 能 在 短 时 间 内 找到 符合 条 件 的 分 块 了 。 

下 面 来 具体 看 一 下 这 个 方法 。 


< 
LILI 


空闲 链表 

























请 给 我 3 个 












图 2.8 只 利用 一 个 空闲 链表 的 情况 
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当 只 利用 一 个 空 闪 链表 时 ， 需 要 遍历 多 次 空 闻 链表 才能 分 配 3 个 字 的 分 块 。 那么 ,利用 
多 个 空闲 链表 时 会 如 何 呢 ? 








请 给 我 3 个 
字 的 分 块 


中 本 “| ”和 本 ”重症 ”剖面 硬 


用 于 2 个 字 
| 
-J 


用 于 3 个 字 




































空闲 链表 的 数组 


图 2.9 利用 多 个 空闲 链表 的 情况 





这 次 数组 的 各 个 元 素 都 位 于 空闲 链表 的 前 面 ， 第 1 个 元 素 是 由 2 个 字 的 分 块 连接 的 空闲 
链表 的 开头 ， 第 2 个 元 素 是 由 3 个 字 的 分 块 连接 的 空闲 链表 的 开头 。 因 此 ， 例 如 在 分 配 3 个 
字 的 分 块 时 ， 只 要 查询 用 于 3 个 字 的 空闲 链表 就 够 了 了 。 比 起 只 利用 一 个 空闲 链表 来 说 ， 此 方 
法 大 幅 节 约 了 分 配 所 需要 的 时 间 。 

不 过 请 稍 等 ， 这 里 有 一 处 需要 我 们 留意 。 那 就 是 到 底 制 造 多 少 个 空闲 链表 才 好 呢 ? 用 于 
2 个 字 的 空闲 链表 、 用 于 3 个 字 的 、 用 于 500 个 字 的 …… 照 这 样 下 去 ,我 们 就 得 准备 无 数 个 
空闲 链表 了 。 

一 般 情 况 下 ，mutator 很 少 会 申请 非常 大 的 分 块 。 为 了 应 对 这 种 极 少 出 现 的 情况 而 大 量 
制造 空 亲 链表， 会 使 得 空闲 链表 的 数组 过 于 巨大 ， 结 果 压 迫 到 内 存 空间 。 
因此 ,我们 通常 会 给 分 块 大 小 设 定 一 个 上 限 ， 分 块 如 果 大 于 等 于 这 个 大 小 ， 就 全 部 采用 
空闲 链表 处 理 。 有 人 可 能 会 想 :“ 这 样 一 来 ， 最 后 不 还 是 没 能 有 效率 地 搜索 大 的 分 块 吗 ?” 
然而 ， 因 为 这 种 分 配 非 常 大 的 分 块 的 情况 是 极为 军 见 的 ， 所 以 效率 低 一 点 也 不 是 什么 大 问题 。 
比 这 更 为 重要 的 是 怎么 去 更 快 地 搜索 mutator 频繁 申请 分 配 的 小 分 块 ， 把 关注 的 重点 移 到 这 
上 面 来 才 是 更 精明 的 做 法 。 打 个 比方 ， 如 果 设 定 分 块 大 小 上 限 为 100 个 字 ， 那么 准备 用 于 2 
人 、100 个 字 ， 以 及 大 于 等 于 101 个 字 的 总 共 100 个 空闲 链表 就 可 以 了 。 

利用 多 个 空闲 链表 时 ， 我 们 需要 修正 new_obj () 函数 以 及 sweep_phase() 函数 。 修 正 
后 的 new_obj() 函数 以 及 sweep_phase() 国 数 分 别 如 代码 清单 2.7、 代 码 清单 2.8 所 示 。 







































































和 2:3 


代码 清单 2.7: 利用 多 个 空闲 链表 的 new_obj() 函数 


1 


OO ON 中 wD 


> 
心 DOD- oO 


new_obj(size){ 
index = size / (WORD_LENGTH / BYTE_LENGTH) 
if(index <= 100) 
if($free_list[index] != NULL) 
chunk = $free_list[index] 
$free_list[index] = $free list[index] .next 
return chunk 
else 
chunk = pickup_chunk (size, $free_list[101]) 
if(chunk != NULL) 


return chunk 


allocation_fail() 


代码 清单 2.8: 利用 多 个 空闲 链表 的 sweep_phase() 函数 


‘OO OO 人 oD Pr- 


FF FF 
‘Oi OO 人 VW OO- oOo 





sweep_phase(){ 
for(i 2..101) 
$free_list[i] = NULL 


sweeping = $heap_start 


while(sweeping < $heap_end) 
if (sweeping.mark == TRUE) 
sweeping.mark = FALSE 
else 
index = size / (WORD_LENGTH / BYTE_LENGTH ) 
if(index <= 100) 
sweeping.next = $free_list[index] 
$free_list[index] = sweeping 
else 
sweeping.next = $free_list[101] 
$free_list[101] = sweeping 


sweeping += sweeping.size 
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2.5 
本 节 中 要 向 大 家 介绍 的 是 BiBOP 法 。BiBOP 是 Big Bag Of Pages 的 缩写 。 这 么 说 可 能 比 
较 难 懂 ， 用 一 句 话 概括 就 是 “将 大 小 相近 的 对 象 整理 成 固定 大 小 的 块 进行 管理 的 做 法 ”。 
我 们 来 详细 说 明 一 下 。 前 面 已 经 跟 大 家 讲 过 ，GC 标记 - 清除 算法 中 会 发 生 碎片 化 。 碎 
片 化 的 原因 之 一 就 是 堆 上 杂乱 散布 厦大 小 各 异 的 对 象 。 
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对 此 ,我 们 可 以 用 这 个 方法 : 把 堆 分 割 成 固定 大 小 的 块 ， 让 每 个 块 只 能 配置 同样 大 小 的 
对 象 。 这 就 是 BiBOP 法 。 
仅 看 文字 说 明 可 能 还 是 比较 难 懂 ， 请 看 下 图 。 


el | Di es 


用 于 3 个 字 的 块 用 于 2 个 字 的 块 用 于 3 个 字 的 块 



















































































用 于 2 个 字 

















用 于 3 个 字 








空闲 链表 的 数组 
图 2.10 BiBOP 法 的 示意 图 


如 图 2.10 所 示 ，3 个 字 的 对 象 被 整合 分 配 到 左 数 第 1 个 和 第 3 个 块 ，2 个 字 的 对 象 被 整 
合 分 配 到 左 数 第 2 个 块 。 像 这 样 配 置 对 象 ， 就 会 提高 内 存 的 使 用 效率 。 因 为 每 个 块 中 只 能 配 
置 同 样 大 小 的 对 象 ， 所 以 不 可 能 出 现 大 小 不 均 的 分 块 。 

但 是 , 使 用 BiBOP 法 并 不 能 完全 消除 碎片 化 。 比 方 说 在 全 部 用 于 2 个 字 的 块 中 ， 只 有 1 
到 2 个 活动 对 象 ， 这 种 情况 下 就 不 能 算是 有 效 利 用 了 堆 。 

BiBOP 法 原本 是 为 了 消除 碎片 化 ， 提 高 堆 使 用 效率 而 采用 的 方法 。 但 像 上 面 这 样 ， 在 多 
个 块 中 分 散 残 留 着 同样 大 小 的 对 象 ， 反 而 会 降低 堆 使 用 效率 。 


:有 位 图 标记 


在 单纯 的 GC 标记 - 清除 算法 中 ， 用 于 标记 的 位 是 被 分 配 到 各 个 对 象 的 头 中 的 。 也 就 是 说 ， 
算法 是 把 对 象 和 头 一 并 处 理 的 。 然 而 之 前 在 2.3.3 节 中 也 提 过 ， 这 跟 写 时 复制 技术 不 兼容 。 

对 此 我 们 有 个 方法 ， 那 就 是 只 收集 各 个 对 象 的 标志 位 并 表格 化 ， 不 跟 对 象 一 起 管理 。 在 
标记 的 时 候 ， 不 在 对 象 的 头 里 置 位 ， 而 是 在 这 个 表格 中 的 特定 场所 置 位 。 像 这 样 集合 了 用 于 













































































2.6 位 图 标记 


标记 的 位 的 表格 称 为 “位 图 表格 ”(bitmap table)， 利 用 这 个 表格 进行 标记 的 行为 称 为 “位 图 标 
记 ”。 位 图 表格 的 实现 方法 有 多 种 ,例如 散 列 表 和 树 形 结 构 等 。 为 了 简单 起 见 ， 这 里 我 们 采 
用 整数 型 数组 。 位 图 标记 的 情况 如 图 2.11 所 示 。 











在 这 里 置 位 


图 2.11 位 图 标记 





在 位 图 标记 中 重要 的 是 ,位 图 表格 中 位 的 位 置 要 和 堆 里 的 各 个 对 象 切 实 对 应 。 一 般 来 说 ， 
堆 中 的 1 个 字 会 分 配 到 1 个 位 ， 我 们 在 本 书 中 也 是 这 么 规定 的 。 
位 图 标记 中 的 mark() 函数 如 代码 清单 2.9 所 示 。 

















代码 清单 2.9: 位 图 标记 中 的 mark() 函数 

mark(obj){ 
obj_num = (obj - $heap_start) / WORD_LENGTH 
index = obj_num / WORD_LENGTH 


上 


offset = obj_num % WORD_LENGTH 


if(($bitmap_tbl[index] & (1 << offset)) == 0) 
$bitmap_tbl[index] |= (1 << offset) 
for(child : children(obj)) 

mark(*child) 


OO oO NO WW Nb 





上 
© 


} 





在 这 里 ，WORD_LENGTH 是 个 常量 ， 表 示 的 是 各 机 器 中 1 个 字 的 位 宽 ( 例 如 32 位 机 器 的 
WORD_LENGTH 就 是 32)。obj_num 指 的 是 从 位 图 表格 前 面 数 起 ，obj 的 标志 位 在 第 几 个 。 例 
如 图 2.11 中 的 卫 ， 它 的 obj_num 值 就 是 8。 然而 请 大 家 注意 ， 图 2.12 中 位 的 排列 顺序 和 图 2.11 
是 相反 的 。 因 此 ,FE 的 标志 位 是 从 bitmap_table[0] 的 右边 起 第 9 个 位 。 
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对 象 的 标志 位 


bitmap_tbl[0] 


bitmap_tbl[1] 








1 个 字 
图 2.12 对象 E 的 标志 位 位 置 
我 们 用 obj_num 除 以 WORD_LENGTH 得 到 的 商 index 以 及 余数 offset 来 分 别 表示 位 图 表 
格 的 行 编号 和 列 编号 。 第 6 行 和 第 7 行 中 用 到 了 位 运算 , 看 上 去 有 些 复杂 ,实际 上 只 是 十 了 
件 非常 简单 的 事情 。 
和 在 对 象 的 头 中 直接 置 标志 位 的 方法 相 比 ， 该 方法 稍微 有 些 复杂 ， 但 是 这 样 做 有 两 个 好 处 。 


2.6.1 ”优点 























2.6.1.1 “与 写 时 复制 技术 兼容 


以 往 的 标记 操作 都 是 直接 对 对 象 设 置 标志 位 ， 这 会 产生 无 谓 的 复制 。 

然而 ， 使 用 位 图 标记 是 不 会 对 对 象 设置 标志 位 的 ， 所 以 也 不 会 发 生 无 谓 的 复制 。 当 然 ， 
因为 对 位 图 表格 进行 了 重 写 ， 所 以 在 此 处 会 发 生 复制 。 不 过 ， 因 为 位 图 表格 非常 小 ， 所 以 即 
使 被 复制 也 不 会 有 什么 大 的 影响 。 

此 外 ， 以 上 问题 只 发 生 在 写 时 复制 技术 的 运行 环境 (Linux 等 ) 中 ， 以 及 频繁 执行 fork() 
函数 的 应 用 程序 中 。 也 就 是 说 ， 它 对 于 一 般 的 程序 来 说 完全 不 是 问题 。 

因此 引发 问题 的 情况 极为 少见 ， 本 书 第 11 章 中 会 举例 为 大 家 详细 说 明 。 

2.6.1.2 ”清除 操作 更 高 效 

不 仅 在 标记 阶段 ， 在 清除 阶段 也 可 以 得 到 好 人 处。 以 往 的 清除 操作 都 必须 遍历 整个 堆 ， 把 
非 活动 对 象 连接 到 空闲 链表 ， 同 时 取消 活动 对 象 的 标志 位 。 


利用 了 位 图 表格 的 清除 操作 则 把 所 有 对 象 的 标志 位 集合 到 一 处 ， 所 以 可 以 快速 消去 标志 位 。 
位 图 标记 中 的 清除 操作 如 代码 清单 2.10 所 示 。 






































代码 清单 2.10: 位 图 标记 的 sweep_phase() 函数 





2.7 延迟 清除 法 “37 


1 | sweep_phase(){ 

2 sweeping = $heap_start 

3 index = 0 

4 offset = 0 

5 

6 while(sweeping < $heap_end) 

东 if($bitmap_tbl[index] & (1 << offset) == 0) 

8 sweeping.next = $free_list 

9 $free_list = sweeping 
10 index += (offset + sweeping.size) / WORD_LENGTH 
414 offset = (offset + sweeping.size) % WORD_LENGTH 
12 sweeping += sweeping.size 
13 
14 for(i : 0..(HEAP_SIZE / WORD_LENGTH - 1)) 
15 $bitmap_tbl[i] = 0 
16 | 】 


与 一 般 的 清除 阶段 相同 ， 我 们 用 sweeping 指针 遍历 整个 堆 。 不 过 ， 这 里 使 用 了 index 
和 offset 两 个 变量 ， 在 遍历 堆 的 同时 也 遍历 位 图 表格 。 
第 6 行 到 第 12 行 是 从 堆 的 开头 开始 遍历 。 第 7 行 是 调查 帝 历 过 程 中 与 对 象 对 应 的 标志 位 。 








当 对 象 没 有 设置 标志 位 时 ， 程 序 会 在 第 8 行 和 第 9 行 





各 此 对 象 连接 到 空闲 链表 。 当 对 象 已 经 





设立 了 标志 位 时 ， 程 序 就 不 会 在 此 进行 消除 位 的 操作 ， 而 是 放 到 之 后 一 并 进行 。 

















第 10 行 、 第 11 行 是 遍历 位 图 表格 ， 第 12 行 是 遍历 堆 。 








第 14 行 、 第 15 行 是 把 所 有 在 位 图 表格 中 设置 的 位 取消 。 因 为 能 够 一 并 消除 标志 位 ， 所 


以 能 够 有 效 地 取消 位 。 
2.6.2 ”要 注意 的 地 方 





在 进行 位 图 标记 的 过 程 中 ， 有 件 事 情 我 们 必须 注意 ， 那 就 是 对 象 地 址 和 位 图 表格 的 对 应 。 
就 像 之 前 和 大 家 说 明 的 那样 ， 想 通过 对 象 的 地 址 求 与 其 对 应 的 标志 位 的 位 置 ， 是 要 进行 位 运 
算 的 。 然 而 在 堆 有 多 个 ， 对 象 地 址 不 连续 的 情况 下 ， 我 们 无 法 用 单纯 的 位 运算 求 出 标志 位 的 
位 置 。 因 此 ， 在 堆 为 多 个 的 情况 下 ， 一般 会 为 每 个 堆 都 准备 一 个 位 图 表格 。 


:各 放 延迟 清除 法 


在 2.1.3 节 的 未 尾 我 们 曾经 提 到 过 ， 清 除 操作 所 花费 的 时 间 是 与 堆 大 小 成 正比 的 。 也 就 是 说 ， 
处 理 的 堆 越 大 ，GC 标记 - 清除 算法 所 花费 的 时 间 就 越 长 ， 结 果 就 会 妨碍 到 mutator 的 处 理 。 
延迟 清除 法 (Lazy Sweep) 是 缩减 因 清 除 操作 而 导致 的 mutator 最 大 暂停 时 间 的 方法 。 在 













































































标记 操作 结束 后 ， 不 一 并 进行 清除 操作 ， 而 是 如 其 字面 意思 一 样 让 它 “延迟 ”， 通 过 “延迟 ” 
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来 防止 mutator 长 时 间 和 暂停 。 那么 ,延迟 清 除 操作 意味 着 什么 呢 ? 
本 书 之 后 会 为 大 家 介绍 R. John M. Hughes 开发 的 延迟 清除 法 。 


2.7.1 ”new_obj() 函数 
延迟 清除 法 中 的 new_obj () 函数 的 定义 如 代码 清单 2.11 所 示 。 


代码 清单 2.11: 延迟 清除 法 中 的 new_obj() 函数 
new_obj(size){ 
chunk = lazy_sweep (size) 
if(chunk != NULL) 
return chunk 


mark_phase() 
chunk = lazy_sweep (size) 


if(chunk != NULL) 
return chunk 


上 上 
FDIOoDD 了 四 性 mwND Pr 


2 
Dh 


allocation_fail() 


} 





3 
[ee] 


在 分 配 时 直接 调用 lazy_sweep() 函数 ， 进 行 清除 操作 。 如 果 它 能 用 清除 操作 来 分 配 分 块 ， 
就 会 返回 分 块 ; 如 果 不 能 分 配 分 块 ， 就 会 执行 标记 操作 。 当 lazy_sweep() 函数 返回 NULL 
时 ,也 就 是 没有 找到 分 块 时 , 会 调用 mark_phase() 函数 进行 一 遍 标记 操作 ， 再 调用 lazy_ 
sweep() 函数 来 分 配 分 块 。 在 这 里 没 能 分 配 分 块 也 就 意味 着 堆 上 没有 分 块 ，mutator 也 就 不 
能 再 进行 下 一 步 处 理 了 。 


2.7.2 lazy_sweep() 函数 
那么 我 们 来 看 一 下 lazy_sweep() 子 数 吧 。 


代码 清单 2.12: lazy_sweep() 函数 


1 | lazy_sweep(size){ 








while($sweeping < $heap_end) 
if($sweeping.mark == TRUE) 
$sweeping.mark = FALSE 
else if($sweeping.size >= size) 
chunk = $sweeping 
$sweeping += $sweeping.size 


return chunk 


OO OO DD 


$sweeping += $sweeping.size 


js 
口 
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二 $sweeping = $heap_start 
12 return NULL 


lazy_sweep() 函数 会 一 直 裔 历 堆 ， 直 到 找到 大 于 等 于 所 申请 大 小 的 分 块 为 止 。 在 找到 
合适 分 块 时 会 将 其 返回 。 但 是 在 这 里 $sweeping 变量 是 全 局 变量 。 也 就 是 说 ,遍历 的 开始 位 
置 位 于 上 一 次 清除 操作 中 发 现 的 分 块 的 右边 。 

当 lazy_sweep() 函数 遍历 到 堆 最 后 都 没有 找到 分 块 时 ， 会 返回 NULL。 

因为 延迟 清除 法 不 是 一 下 遍历 整个 堆 ， 它 只 在 分 配 时 执行 必要 的 遍历 ， 所 以 可 以 压缩 因 
清除 操作 而 导致 的 mutator 的 暂停 时 间 。 这 就 是 “ 延 公 ”清除 操作 的 意思 。 


2.7.3 ”有 延迟 清除 法 就 够 了 吗 


我 们 已 经 知道 ， 通 过 延迟 清除 法 可 以 缩减 mutator 的 暂停 时 间 ， 不 过 这 是 真 的 吗 ? 稍微 想 想 
看 就 会 明白 ， 延 迟 清 除 的 效果 是 不 均衡 的 。 打 个 比方 ,假设 刚 标 记 完 的 堆 的 情况 如 图 2.13 所 示 。 
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图 2.13” 堆 里 垃圾 分 布 不 均 的 情况 








也 就 是 说 ， 垃 圾 变 成 了 垃圾 堆 ， 活 动 对 象 变 成 了 活动 对 象 堆 ， 它 们 形成 了 一 种 邻接 的 状 
态 。 在 这 种 情况 下 ， 程 序 在 清除 垃圾 较 多 的 部 分 时 能 马上 获得 分 块 ， 所 以 能 减少 mutator 的 
暂停 时 间 。 然 而 一 旦 程序 开始 清除 活动 对 象 周围 ， 就 怎么 也 无 法 获得 分 块 了 ， 这 样 就 增加 了 
mutator 的 暂停 时 间 。 

结果 ， 如 果 一 下 子 清除 的 堆 大 小 不 一 定 ， 那 么 mutator 的 暂停 时 间 就 会 增 大 。 关 于 保持 
所 清除 的 堆 大 小 的 方法 我 们 将 在 第 8 章 中 详细 为 大 家 说 明 。 

虽然 在 这 里 没有 特别 提 及 ， 不 过 标记 阶段 导致 的 暂停 时 间 和 清除 阶段 导致 的 暂停 时 间 一 
样 ， 也 是 个 问题 。 关 于 如 何 改善 这 个 问题 ， 我 们 也 会 在 第 8 章 中 为 大 家 解说 。 
































引用 计数 法 





GC 原本 是 一 种 “释放 怎么 都 无 法 被 引用 的 对 象 的 机 制 *。 那么 人 们 自然 而 然 地 就 会 
想到 ， 可 以 让 所 有 对 象 事先 记录 下 “有 多 少 程序 引用 自己 ”。 让 各 对 象 知道 自己 的 人气 指 
数 "， 从 而 让 没有 人 和 气 的 对 象 自己 消失 ， 这 就 是 引用 计数 法 (Reference Counting )， 它 是 
George E. Collins 外 于 1960 年 钻研 出 来 的 。 





有 
~ 人 人 个 人 人 
AAA 全 


"天 量 明 引用 计数 的 算法 


引用 计数 法 中 引入 了 一 个 概念 ， 那 就 是 “计数 器 "。 计 数 器 表示 的 是 对 象 的 人 气 指 数 ， 
也 就 是 有 多 少 程序 引用 了 这 个 对 象 (被 引用 数 )。 计 数 需 是 无 符号 的 整数 ， 用 于 计数 需 的 位 数 
根据 算法 和 实现 而 有 所 不 同 。 引 用 计数 法 中 的 对 象 如 图 3.1 所 示 。 
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本 国 于 重量 


计数 器 域 





图 3.1 引用 计数 法 中 的 对 象 

















那么 ,让 我 们 来 看 看 在 引用 计数 法 中 是 怎样 进行 内 存 管 理 的 吧 。 


3.1.1 “计数 器 值 的 增 凋 


在 GC 标记 - 清除 算法 等 其 他 GC 算法 中 ， 没 有 分 块 时 mutator 会 调用 下 面 这 样 的 函数 ， 
启动 GC 分 配 空 闲 的 内 存 空间 。 


代码 清单 3.1: garbage_collect() 函数 
1 | garbage_collect (){ 
2 
3 | 了 








然而 在 引用 计数 法 中 并 没有 mutator 明确 启动 GC 的 语句 。 引 用 计数 法 与 mutator 的 执行 
密切 相关 ， 它 在 mutator 的 处 理 过 程 中 通过 增 减 计数 器 的 值 来 进行 内 存 管 理 。 在 两 种 情况 下 
计数 需 的 值 会 发 生 增 减 ， 这 涉及 了 new_obj () 子 数 和 update_ptr() 函数 。 


3.1.2 ”new _ obj(0) 函数 


代码 清单 3.2: new_obj() 函数 


new_obj(size){ 

















[uy 


obj = pickup_chunk(size, $free_list) 


if(obj == NULL) 
allocation_fail() 
else 
obj.ref_cnt = 1 


return obj 





‘OO OR Dh 


} 


与 GC 标记 - 清除 算法 相同 ，mutator 在 生成 新 对 象 的 时 候 会 调用 new_obj () 印 数 。 

在 这 里 ，pickup_chunk() 函数 的 用 法 也 大 致 与 在 GC 标记 - 清除 算法 中 的 用 法 相同 。 不 
过 这 次 当 pickup_chunk() 函数 返回 NULL 时 ， 分 配 就 失败 了 。 关于 这 点 我 们 也 会 在 之 后 的 3.2.1 
节 中 为 大 家 说 明 。 在 引用 计数 法 中 ， 除 了 连接 到 空闲 链表 的 对 象 ， 其 他 所 有 对 象 都 是 活动 对 
象 。 也 就 是 说 ， 在 pickup_chunk() 函数 返回 NULL 那 一 刻 ， 堆 中 就 没有 合适 大 小 的 分 块 了 ， 
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分 配 就 无 法 进行 了 。 

当 通过 pickup_chunk() 函数 返回 合适 大 小 的 对 象 时 ， 在 第 7 行 把 计数 需 的 值 定 为 1。 
明显 ， 这 里 新 生成 了 对 象 ， 且 对 象 被 某 处 引用 了 。 另 外 , 域 ref_cnt 代表 对 象 obj a 
这 点 在 本 章 之 后 也 一 样 ， 请 大 家 牢记 。 


3.1.3 update_ptr() 函数 
update_ptr() 函数 用 于 更 新 指针 ptrz， 使 其 指向 对 象 obj ， 同 时 进行 计数 需 值 的 增 减 。 


代码 清单 3.3: update_ptr() 函数 
1 | update_ptr(ptr, obj)t{ 





inc_ref_cnt (obj) 


2 
3 dec_ref_cnt (*ptr) 
4 *ptr = obj 

5 


} 





虽然 在 mutator 更 新 指针 时 程序 会 执行 此 函数 ,但 事实 上 进行 指针 更 新 的 只 有 第 4 行 的 
*ptr = obj 部 分 ,第 2 行 和 第 3 行 是 进行 内 存 管理 的 代码 。 程 序 具体 进行 的 是 以 下 2 项 操作 。 











1. 对 指针 ptr 新 引用 的 对 象 (obj ) 的 计数 器 进行 增 量 操作 
2. 对 指针 ptr 之 前 引用 的 对 象 (*ptr) 的 计数 器 进行 减 量 操作 





首先 我 们 要 介绍 的 是 执行 计数 天 增 量 操作 的 inc_ref_cnt() 函数 。 


代码 清单 3.4: inc_ref_cnt() 函数 
1 | inc_ref_cnt (obj){ 
2 obj .ref_cnt++ 


3 | 了 





inc_ref_cnt() 因数 是 一 个 简单 的 函数 ， 它 只 对 新 引用 的 对 象 obj 的 计数 需 进 行 增 量 操作 。 
下 面 我 们 再 来 看 看 进行 计数 需 减 量 操作 的 dec_ref_cnt() 函数 。 


代码 清单 3.5: dec_ref_cnt() 函数 
1 | dec_ref_cnt (obj){ 
2 obj:ref. cnt== 
3 if(obj.ref_cnt == 0) 
4 for(child : children(obj)) 
5 dec_ref _cnt (*child) 
6 
7 


reclaim(obj) 





} 


首先 对 更 新 指针 之 前 引用 的 对 象 *ptz 的 计数 需 进 行 减 量 操作 。 减 量 操作 后 ， 计 数 需 的 
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值 为 0 的 对 象 变 成 了 “垃圾 "。 因 此 ， 这 个 对 象 的 指针 会 全 部 被 删除 。 换 言 之 ， 程 序 需要 对 
*ptr 的 子 对 象 的 计数 器 进行 减 量 操作 。 在 第 5 行 递归 调用 dec_ref_cnt() 函数 就 是 为 了 这 个 。 
然后 ， 通 过 reclaim() 函数 将 obj 连接 到 空闲 链表 。reclaim() 函数 会 在 本 章 中 多 次 出 现 ， 
请 牢记 。 

那么 ， 看 到 这 里 大 家 会 不 会 心 生 疑问 呢 ? 为 什么 要 先 调用 inc_ref_cnt() 函数 ， 后 调用 
dec_ref_cnt() 函数 呢 ? 从 引用 计数 算法 的 角度 来 考虑 ， 先 调用 dec_ref_cnt () 印 数 ， 后 调 
用 inc_ref_cnt() 函数 才 合 适 吧 。 答 案 就 是 “为 了 处 理 *ptr 和 obj 是 同一 对 象 时 的 情况 ”。 
如 果 按 照 先 dec_ref_cnt() 后 inc_ref_cnt() 函数 的 顺序 调用 ，*ptr 和 obj 又 是 同一 对 象 
的 话 ， 执 行 dec_ref_cnt (*ptr) 时 *ptr 的 计数 需 的 值 就 有 可 能 变 为 0 而 被 回收 。 这 样 一 来 ， 
下 面 再 想 执行 inc_ref_cnt (obj) 时 obj 早 就 被 回收 了 ， 可 能 会 引发 重大 的 BUG。 因 此 我 们 
要 通过 先 对 obj 的 计数 需 进 行 增 量 操作 来 回避 这 种 BUG。 

最 后 结合 图 片 来 看 一 下 update_ptr() 函数 执行 时 的 情况 。 请 看 图 3.2(a)。 初 始 状 态 下 从 
根 引 用 A 和 C， 从 A 引用 B。A 持 有 唯一 指向 B 的 指针 ， 假 设 现在 将 该 指针 更 新 到 了 C， 请 
看 图 3.2(b)。 


空闲 链表 Cs >) 空闲 链表 ， 


| > 




























































































3.2 update_ptr() 函数 执行 时 的 情况 








通过 以 上 的 更 新 ，B 的 计数 需 值 变 成 了 0， 因此 3 被 回收 了 。 且 B 连接 上 了 空闲 链表 ， 
能 够 再 被 利用 了 。 又 因为 新 形成 了 由 A 指向 C 的 指针 ， 所 以 C 的 计数 需 的 值 增 量 为 2。 

在 变更 数组 元 素 等 的 时 候 会 进行 指针 的 更 新 。 通 过 更 新 指针 ， 可 能 会 产生 没有 被 任何 程 
序 引 用 的 垃圾 对 象 。 引 用 计数 法 中 会 监督 在 更 新 指针 的 时 候 是 否 有 产生 垃圾 ， 从 而 在 产生 
垃圾 时 将 其 立刻 回收 。 也 就 是 说 ,这 意味 着 在 分 配 时 没有 分 块 的 情况 下 ， 堆 中 所 有 的 对 象 
都 为 活动 对 象 ， 这 时 没 法 新 分 配对 象 。 另 一 方面 ，GC 标记 - 清除 算法 即使 产生 了 垃圾 也 不 
会 将 其 马上 回收 ， 只 会 在 没有 分 块 的 时 候 将 垃圾 一 并 回收 。 像 这 样 ， 可 以 说 将 内 存 管理 和 
mutator 同 时 运 行 正 是 3 | 用 计数 法 的 一 大 寺 征 o 

以 上 就 是 对 引用 计数 的 算法 的 说 明 。 
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FE 


3.2.1 “可 即刻 回收 垃圾 


在 引用 计数 法 中 ， 每 个 对 象 始终 都 知道 自己 的 被 引用 数 (就 是 计数 需 的 值 )。 当 被 引用 数 
的 值 为 0 时 ， 对 象 马上 就 会 把 自己 作为 空闲 空间 连接 到 空闲 链表 。 也 就 是 说 ， 各 个 对 象 在 变 
成 垃圾 的 同时 就 会 立刻 被 回收 。 要 说 这 有 什么 意义 ， 那 就 是 内 存 空 间 不 会 被 垃圾 占领 。 垃 圾 
全 部 都 已 连接 到 空闲 链表 ， 能 作为 分 块 再 被 利用 。 

男 一 方面 ,在 其 他 的 GC 算法 中 ， 即 使 对 象 变 成 了 垃圾 ,程序 也 无 法 立刻 判别 。 只 有 当 
分 块 用 尽 后 GC 开始 执行 时 ， 才 能 知道 哪个 对 象 是 垃圾 ,哪个 对 象 不 是 垃圾 。 也 就 是 说 ， 直 
到 GC 执行 之 前 ， 都 会 有 一 部 分 内 存 空间 被 垃圾 占用 。 


3.2.2 ”最 大 暂停 时 间 短 

在 引用 计数 法 中 ， 只 有 当 通 过 mutator 更 新 指针 时 程序 才 会 执行 垃圾 回收 。 也 就 是 说 ， 
每 次 通过 执行 mutator 生成 垃圾 时 这 部 分 垃圾 都 会 被 回收 ， 因 而 大 幅度 地 削减 了 mutator 的 最 
大 暂停 时 间 。 

就 如 我 们 在 第 1 章 中 所 说 的 那样 ， 根 据 mutator 的 用 途 不 同 ， 最 大 暂停 时 间 的 长 短 会 成 
为 非常 重要 的 因素 。 

3.2.3 ”没有 必要 沿 指 针 查 找 

引用 计数 法 和 GC 标记 - 清除 算法 不 一 样 ， 没 必要 由 根 沿 指针 查找 。 当 我 们 想 减 少 沿 指 
针 查 找 的 次 数 时 ， 它 就 派 上 用 场 了 。 

打 个 比方 ,在 分 布 式 环境 中 ， 如 果 要 沿 各 个 计算 节点 之 间 的 指针 进行 查找 ， 成 本 就 会 增 
大 ， 因 此 需要 极力 控制 沿 指针 查找 的 次 数 。 

所 以 ， 有 一 种 做 法 是 在 各 个 计算 节点 内 回收 垃圾 时 使 用 CC 标记 - 清除 算法 ， 在 考虑 到 
节点 间 的 引用 关系 时 则 采用 引用 计数 法 。 


3.3.1 “计数 器 值 的 增 减 处 理 繁重 

虽然 依据 执行 的 mutator 的 动作 不 同 而 略 有 差距 ， 我 们 不 能 一 概 而 论 ， 不 过 在 大 多 数 情 
况 下 指针 都 会 频繁 地 更 新 。 特 别 是 有 根 的 指针 ， 会 以 近乎 令 人 目眩 的 势头 飞速 地 进行 更 新 。 
这 是 因为 根 可 以 通过 mutator 直接 被 引用 。 在 引用 计数 法 中 ， 每 当 指针 更 新 时 ， 计 数 器 的 值 









































3.3 ”缺点 


都 会 随 之 更 新 ， 因 此 值 的 增 减 处 理 必然 会 变 得 繁重 。 
关于 解决 这 个 问题 的 方法 ， 我 们 将 在 3.4 节 中 为 大 家 介绍 。 


3.3.2 ”计数 器 需要 占用 很 多 位 


用 于 引用 计数 的 计数 器 最 大 必须 能 数 完 堆 中 所 有 对 象 的 引用 数 。 打 个 比方 假如 我 们 用 
的 是 32 位 机 器 ， 那 么 就 有 可 能 要 让 2 的 32 次 方 个 对 象 同时 引用 一 个 对 象 。 考 虑 到 这 种 情况 ， 
就 有 必要 确保 各 对 象 的 计数 器 有 32 位 大 小 。 也 就 是 说 ， 对 于 所 有 对 象 ， 必须 留 有 32 位 的 空 
间 。 这 就 害 得 内 存 空间 的 使 用 效率 大 大 降低 了 。 打 比方 说 ， 假 如 对 象 只 有 2 个 域 ， 那 么 其 计 
数 器 就 占 了 它 整体 的 1/3。 


3.3.3 ”实现 烦琐 复杂 


引用 计数 的 算法 本 身 很 简单 ， 但 事实 上 实现 起 来 却 不 容易 。 

进行 指针 更 新 操作 的 update_ptr() 函数 是 在 mutator 这 边 调用 的 。 打 个 比方 ,我 们 需要 
把 以 往 写成 *ptr=obj 的 地 方 都 重 写成 update_ptr(ptr,obj)。 因 为 调用 update_ptr() 后 
数 的 地 方 非常 多 ， 所 以 重 写 过 程 中 很 容易 出 现 遗 漏 。 如 果 漏 掉 了 某 处 ， 内 存 管 理 就 无 法 正确 
进行 ， 就 会 产生 BUG。 


3.3.4 ”循环 引用 无 法 回收 




















代码 清单 3.6: 循环 垃圾 的 生成 








1 | class Person{ # 定 义 Person 类 

2 string name 

3 Person lover 

4|} 

5 

6 | taro = new Person(" 太 郎 ") # 生 成 Person 类 的 实例 太朗 
7 | hanako = new Person(" 花子 ") # 生 成 Pearson 类 的 实例 花子 
8 | taro.lover = hanako # 大 即 喜 欢 花 子 

9 | hanako.lover = taro # 花子 喜欢 太 即 

10 | taro = null # 将 taro 转 换 为 null 

11 | hanako = null # 将 hanako 转换 为 null 




















上 述 伪 代码 表示 的 是 某 对 情侣 。 在 执行 这 段 伪 代码 后 ， 对 象 的 情况 如 图 3.3 所 示 。 
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图 3.3 循环 引用 对 象 








像 上 述 这 样 ， 因 为 两 个 对 象 互 相 引 用 ， 所 以 各 对 象 的 计数 器 的 值 都 是 1。 但 是 这 些 对 象 
组 并 没有 被 其 他 任何 对 象 引 用 。 因 此 想 一 并 回收 这 两 个 对 象 都 不 行 ， 只 要 它们 的 计数 器 值 都 
是 1， 就 无 法 回收 。 像 这 样 在 两 个 及 两 个 以 上 的 对 象 互相 循环 引用 形成 对 象 组 的 情况 下 ， 即 
使 这 些 对 象 组 都 成 了 垃圾 ， 程 序 也 无 法 将 它们 回收 。 
我 们 说 了 很 多 引用 计数 法 的 缺点 ， 像 “处 理 繁 重 ”“ 内 存 使 用 效率 低下 ” 等 。 那 么 引用 计 
数 法 是 不 是 一 个 “完全 没 法 用 ”的 算法 呢 ? 不 ， 绝 对 不 是 。 事 实 上 ， 很 多 处 理 系统 和 应 用 都 
在 使 用 引用 计数 法 。 

要 说 为 什么 ,， 那 是 因为 引用 计数 法 只 要 稍 加 改良 ， 就 会 变 得 非常 具有 实用 性 了 。 之 后 我 
们 将 对 如 何 改 良 引用 计数 法 进行 解说 。 


忆 延迟 引用 计数 法 


3.4.1 _ 什么 是 延迟 引用 计数 法 


在 讲 引 用 计数 法 的 缺点 时 ,我 们 提 到 了 其 中 一 项 是 “计数 器 值 的 增 减 处 理 繁重 ”。 下 面 
就 对 改善 此 缺点 的 方法 进行 说 明 ， 即 延迟 引用 计数 法 (Deferred Reference Counting )。 这 个 方 
法 是 L. Peter Deutsch 和 Daniel G. Bobrow 色 研究 出 来 的 。 

如 3.3.1 节 中 所 述 ， 计 数 带 值 增 减 处 理 繁重 的 原因 之 一 是 从 根 的 引用 变化 频繁 。 

因此 ， 我 们 就 让 从 根 引 用 的 指针 的 变化 不 反映 在 计数 器 上 。 打 个 比方 ,我 们 把 重 写 全 局 
变量 指针 的 update_ptr($ptr,obj) 改写 成 *$ptr = obj。 

如 上 所 述 ， 这 样 一 来 即使 频繁 重 写 堆 中 对 象 的 引用 关系 ， 对 象 的 计数 器 值 也 不 会 有 所 变 
化 ， 因 而 大 大 改善 了 “计数 需 值 的 增 减 处 理 人 繁重 ”这 一 缺点 。 

然而 ， 这 样 内 存 管理 还 是 不 能 顺利 进行 。 因 为 引用 没有 反映 到 计数 器 上 ， 所 以 各 个 对 象 
的 计数 器 没有 正确 表示 出 对 象 本 身 的 被 引用 数 ( 即 人 气 )。 因 此 ， 有 可 能 发 生 对 象 仍 在 活动 ， 
但 却 被 错 当 成 垃圾 回收 的 情况 。 
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上 和 一 


3.4 ”实际 上 仍 在 活动 ， 但 计数 器 值 却 为 0 的 对 象 




















于 是 ,我 们 在 延迟 引用 计数 法 中 使 用 ZCT(Zero Count Table )。ZCT 是 一 个 表 ， 它 会 事先 
记录 下 计数 器 值 在 uec_ref_cnt() 函数 的 作用 下 变 为 0 的 对 象 。ZCT 的 示意 图 如 图 3.5 所 示 。 





图 3.5 ZCT 





因为 计数 需 值 为 0 的 对 象 不 一 定 都 是 垃圾 ， 所 以 暂时 先 将 这 些 对 象 保留 。 由 图 3.5 也 能 
看 出 ， 我 们 必须 修正 dec_ref_cnt() 函数 ， 使 其 适应 延迟 引用 计数 法 。 





3.4.2 ”dec _ ref _cnt() 函数 
关于 在 延迟 引用 计数 法 中 用 到 的 qec_ref_cnt() 函数 ， 其 定义 如 代码 清单 3.7 所 示 。 


代码 清单 3.7: 延迟 引用 计数 法 中 的 dec_ref_cnt() 函数 
1 | dec_ref_cnt (obj){ 
obj.ref_cnt-- 
if(obj.ref_cnt == 0) 
if(is_full($zct) == TRUE) 
scan_zct() 
push($zct, obj) 
} 





Nm a 人 W DD 

















当 obj 的 计数 需 值 为 0( 也 就 是 说 obj 可 能 是 垃圾 ) 时 ， 在 第 6 行 把 obj 添加 到 $zct。 不 过 ， 
如 果 $zct 爆满 ， 那么 首先 就 要 通过 scan_zct () 因数 来 减少 $zct 中 的 对 象 ( 第 4 行 、 第 5 行 )。 
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3.4.3 ”new _ obj() 函数 
我 们 也 要 稍微 修正 一 下 new_obj() 函数 。 当 无 法 分 配 大 小 合适 的 分 块 时 ， 执行 scan_ 
zct() 限 数 。 


代码 清单 3.8: 延迟 引用 计数 法 中 的 new_obj() 函数 


oOo WO Pp 


> 卢 
Dp OO 


new_obj(size){ 


obj = pickup_chunk(size, $free_list) 


if (obj == NULL) 
scan_zct() 
obj = pickup_chunk(size, $free_list) 
if (obj == NULL) 


allocation_fail() 


obj.ref_cnt = 1 
return obj 


} 





如 果 第 一 次 分 配 没 有 顺利 进行 ， 就 意味 着 空闲 链表 中 没有 了 大 小 合适 的 分 块 。 此 时 程序 
要 搜索 一 遍 $zct ， 以 再 次 分 配 分 块 。 如 果 这 样 还 不 行 ， 分 配 就 失败 了 。 





分 配 顺利 进行 之 后 的 流程 通常 与 引用 计数 法 完全 一 样 。 














3.4.4 ”Scan_zct() 了 国 数 


scan_zct() 因数 的 伪 代 码 如 下 所 示 。 


代码 清单 3.9: scan_zct() 函数 


‘OO OO 人 oO 


2 卢 
Dp-»- OO 


scan_zct (){ 
for(r : $roots) 


(*r) .ref_cnt++ 


for(obj : $zct) 
if(obj.ref_cnt == 0) 
remove($zct, obj) 
delete(obj) 


for(r : $roots) 


(*r) .ref_cnt--— 





} 





在 第 2 行 和 第 3 行 ， 程 序 把 所 有 通过 根 直 接 引 用 的 对 象 的 计数 器 都 进 











把 根 引用 反映 到 了 计数 需 的 值 上 。 


区 


行 计 


二 


日 里 o 


这 样 才 算 
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接 下 来 调查 所 有 与 $zct 相连 的 对 象 ， 如 果 存 在 计数 器 值 为 0 的 对 象 ， 则 将 此 对 象 从 $zct 
中 删除 ， 并 执行 以 下 2 项 操作 。 


1. 对 子 对 象 的 计数 器 进行 减 量 操作 
2. 回收 


负责 这 2 项 操作 的 delete() 函数 的 定义 如 代码 清单 3.10 所 示 。 


代码 清单 3.10: delete() 函数 
1 | delete(obj){ 
for(child : children(obj) 
(*child) .ref_cnt-- 
if((*child) .ref_cnt == 0) 
delete(*child) 


reclaim(obj) 


下 





oo oo DD 


对 obj 的 子 对 象 的 计数 器 进行 减 量 操作 ， 对 计数 器 值 变 成 0 的 对 象 执 行 delete() 函数 ， 
最 后 回收 obj。 
最 后 把 所 有 根 引用 的 对 象 的 计数 器 都 进行 减 量 操作 。 


3.4.5 ”优点 


在 延迟 引用 计数 法 中 ， 程 序 延 迟 了 根 引用 的 计数 ， 将 垃圾 一 并 回收 。 通 过 延 退 ， 减 轻 了 
因 根 引用 频繁 发 生变 化 而 导致 的 计数 融 增 减 所 带 来 的 额外 负担 。 


3.4.6 ”缺点 


为 了 延迟 计数 器 值 的 增 减 ， 垃 圾 不 能 马上 得 到 回收 ， 这 样 一 来 垃圾 就 会 压迫 堆 ， 我 们 也 
就 失去 了 引用 计数 法 的 一 大 优点 可 即刻 回收 垃圾 。 

另外 ，scan_zct() 困 数 导致 最 大 暂停 时 间 延 长 了 。 执 行 scan_zct() 函数 所 花费 的 时 间 
与 $zct 的 大 小 成 正比 。$zct 越 大 ， 要 搜索 的 对 象 就 越 多 ， 妨 碍 mutator 运作 的 时 间 也 就 越 长 。 
要 想 缩 减 因 scan_zct() 函数 而 导致 的 暂停 时 间 ， 就 要 缩小 $zct。 但 是 这 样 一 来 调用 scan_ 
zct() 函数 的 频率 就 增加 了 ， 也 压低 了 吞吐 量 。 很 明显 这 样 就 本 末 倒 置 了 。 
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“下 ;和 Sticky 引用 计数 法 


3.5.1 “什么 是 Sticky 引用 计数 法 


在 引用 计数 法 中 ， 我 们 有 必要 花 功夫 来 研究 一 件 事 ， 那 就 是 要 为 计数 融 设 置 多 大 的 位 宽 。 
假设 为 了 反映 所 有 引用 ,计数 器 需要 1 个 字 (32 位 机 器 就 是 32 位 ) 的 空间 。 但 是 这 样 会 大 量 
消耗 内 存 空间 。 打 个 比方 ，2 个 字 的 对 象 就 要 附加 1 个 字 的 计数 器 。 也 就 是 说 ， 计 数 器 害 得 


对 象 所 占 空间 增 大 了 1.5 信 。 
Wl 


计数 融 域 






























































3.6 ”对 象 拥有 两 个 1 个 字 的 域 以 及 一 个 1 个 字 的 计数 器 





对 此 我 们 有 个 方法 ， 那 就 是 用 来 减少 计数 占 位 宽 的 “Sticky 引用 计数 法 ”。 举 个 例子 ,我 
们 假设 用 于 计数 融 的 位 数 为 5 位 ,那么 这 种 计数 需 最 多 只 能 数 到 2 的 5 次 方 减 1， 也 就 是 31 
个 引用 数 。 如 果 此 对 象 被 大 于 31 个 对 象 引 用 ,那么 计数 需 就 会 溢出 。 这 跟 车 辆 速度 计 的 指 
针 爆 表 是 一 个 状况 。 

针对 计数 器 溢出 (也 就 是 爆 表 的 对 象 )， 需 要 暂停 对 计数 咒 的 管理 。 对 付 这 种 对 象 ， 我 们 
主要 有 两 种 方法 。 


3.5.2 ”什么 都 不 做 

对 于 计数 带 洲 出 的 对 象 ， 我 们 可 以 这 样 处 理 : 不 再 增 减 计数 器 的 值 ， 就 把 它 放 着 ， 什 么 
也 不 做 ,不 过 这 样 一 来 ， 即 使 这 个 对 象 成 了 垃圾 ( 即 被 引用 数 为 0)， 也 不 能 将 其 回收 。 也 就 是 说 ， 
白白 浪费 了 内 存 空间 。 

然而 事实 上 有 很 多 研究 表明 ， 很 多 对 象 一 生成 马上 就 死 了 (详情 请 参考 第 7 章 )。 也 就 是 说 ， 
在 很 多 情况 下 ， 计 数 器 的 值 会 在 0 到 1 的 范围 内 变化 ， 鲜 少 出 现 5 位 计数 器 溢出 这 样 的 情况 。 

此 外 ， 因 为 计数 絮 洪 出 的 对 象 在 执行 中 的 程序 里 占有 非常 重要 的 地 位 ， 所 以 可 想 而 知 ， 其 将 
来 成 为 垃圾 的 可 能 性 也 很 低 。 也 就 是 说 ， 不 增 减 计数 器 的 值 ， 就 把 它 那 么 放 着 也 不 会 有 什么 大 问题 。 

考虑 到 以 上 事项 ， 对 于 计数 需 溢 出 的 对 象 ， 什么 也 不 做 也 不 失 为 一 个 可 用 的 方法 。 


3.5.3 _ 使 用 GC 标记 -清除 算法 进行 管理 


男 一 个 方法 是 ， 在 适当 时 机 用 GC 标记 - 清除 算法 来 充当 引用 计数 法 的 后 援 。 但 是 我 们 
在 这 里 用 到 的 GC 标记 - 清除 算法 和 以 往 的 有 所 不 同 。 































































































3.5 ”Sticky 引 用 计数 法 








代码 清单 3.11: 作为 备用 的 GC 标记 -清除 算法 


1 


有 2 
3 
4 
5 


mark_sweep_for_counter_overflow(){ 
reset_all_ref_cnt() 
mark_phase() 
sweep_phase() 

} 


首先 ， 在 第 2 行 把 所 有 对 象 的 计数 天 值 都 设 为 0。 下 面 ， 我 们 进入 标记 阶段 和 清除 阶段 。 


代码 清单 3.12: 标记 阶段 


1 


OO oO No a PW Dd 


上 乙己 


mark_phase(){ 
for(r : $roots) 


push(*r, $mark_stack) 


while(is_empty($mark_stack) == FALSE) 
obj = pop($mark_stack) 
Obj.ref_cnt++ 
if(obj.ref_cnt == 1) 
for(child : children(obj)) 
push(*child, $mark_stack) 





上 


在 标记 阶段 ， 首 先 把 由 根 直接 引用 的 对 象 堆 到 标记 栈 里 ， 然 后 按 顺 序 从 标记 栈 取 出 对 象 ， 











对 计数 絮 进 行 增 量 操作 。 不 过 ， 这 里 必须 只 把 各 个 对 象 及 其 子 对 象 堆 进 标记 栈 一 次 。 在 第 8 
行 会 检查 各 个 对 象 是 不 是 只 堆 进 去 了 一 次 。 一 旦 栈 为 空 ， 则 标记 阶段 结 


代码 清单 3.13: 清除 阶段 


上 


OW DD 





























sweep_phase(){ 
sweeping = $heap_top 
while(sweeping < $heap_end) 
if(sweeping.ref_cnt == 0) 
reclaim(sweeping) 
sweeping += sweeping.size 
} 





在 清除 阶段 ， 程 序 会 搜索 整个 堆 ， 回 收 计数 器 值 仍 为 0 的 对 象 。 
我 们 在 这 里 介绍 的 GC 标记 - 清除 算法 和 在 第 2 章 中 介绍 的 GC 标记 - 清除 算法 主要 有 


以 下 3 点 不 同 。 


1. 一 开始 就 把 所 有 对 象 的 计数 器 值 设 为 0 
2. 不 标记 对 象 ， 而 是 对 计数 器 进行 增 量 操作 
3. 为 了 对 计数 器 进行 增 量 操作 ， 算 法 对 活动 对 象 进行 了 不 止 一 次 的 搜索 


1 
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像 这 样 ， 只 要 把 引用 计数 法 和 GC 标记 - 清除 算法 结合 起 来 ， 在 计数 需 滋 出 后 即使 对 象 
成 了 垃圾 ， 程 序 还 是 能 回收 它 。 另 外 还 有 一 个 优点 ， 那 就 是 还 能 回收 循环 的 垃圾 。 

但 是 在 进行 标记 处 理 之 前 ， 必 须 重 置 所 有 的 对 象 和 计数 器 。 此 外 ， 因 为 在 查找 对 象 时 没 
有 设置 标志 位 而 是 把 计数 天 进行 增 量 ， 所 以 需要 多 次 (次 数 和 被 引用 数 一 致 查找 活动 对 象 。 
考虑 到 这 一 点 的 话 ， 显 然 在 这 里 进行 的 标记 处 理 比 以 往 的 GC 标记 - 清除 算法 中 的 标记 处 理 
要 花 更 多 的 时 间 。 也 就 是 说 ， 吞 吐 量 会 相应 缩小 。 


“外 和 1 位 引用 计数 法 


3.6.1 ”什么 是 1 位 引用 计数 法 


1 位 引用 计数 法 (1bit Reference Counting) 是 Sticky 引用 计数 法 的 一 个 极端 例子 。 因 为 计 
数 絮 只 有 1 位 大 小 ， 所 以 瞬间 就 会 溢出 ， 看 上 去 几乎 没什么 意义 。 

不 过 ， 据 Douglas W. Clark 和 C. Cordell Green 5 观察 ,“ 几 乎 没有 对 象 是 被 共有 的 ， 所 
有 对 象 都 能 被 马上 回收 ?。 考 虑 到 这 一 点 ， 即 使 计数 器 只 有 1 位 ， 通 过 用 0 表示 被 引用 数 为 1， 
用 1 表示 被 引用 数 大 于 等 于 2， 这 样 也 能 有 效率 地 进行 内 存 管 理 。 使 用 1 位 计数 器 时 各 对 象 
的 处 理 方法 如 图 3.7 所 示 。 


被 引用 数 +1 a 


计数 器 :0 
被 引用 数 : 1 














































































































计数 器 :1 洲 - 区 
肯 数 : 大 于 等 于 2 和 被 引用 数 -1 


被 引用 数 -1 回收 对 象 
3.7 ”使 用 1 位 计数 器 的 对 象 的 处 理 方法 












































也 就 是 说 ， 我 们 用 1 位 来 表示 某 个 对 象 的 被 引用 数 是 1 个 还 是 多 个 。 此 外 ， 引 用 计数 法 一 
般 会 让 对 象 持 有 计数 器 ,但 W. R. Stoye、T.J.W.Clarke、A.C.Norman 上 43 个 人 想 出 了 工 位 引 
用 计数 法 ， 以 此 来 让 指针 持 有 计数 器 。 本 节 中 将 介绍 这 个 算法 。 不 过 因为 是 “1 位 ”引用 计数 法 ， 
所 以 与 其 叫 它 计数 器 ,不 如 叫 它 “标签 ”(tag) 更 为 妥当 。 设 对 象 引 用 数 为 1 时 标签 位 为 0， 引 
用 数 为 复数 时 标签 位 为 1。 我 们 分 别称 以 上 2 种 状态 为 UNIQUE 和 MULTIPLE， 处 于 UNIQUE 状 
态 下 的 指针 为 “UNIQUE 指针 ”， 人 处 于 MULTIPLE 状态 下 的 指针 为 “MULTIPLE 指针 ”。 

那么 问题 来 了 ,我们 要 如 何 实 现 这 个 算法 呢 ?” 其 实 ， 因 为 指针 通常 默认 为 4 字 节 对 齐 ， 
所 以 没 法 利用 低 2 位。 只 要 好 好 利用 这 个 性 质 ， 就 能 确保 拿 出 1 位 来 用 作 内 存 管理 。 
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3.6.2 coOpy_ptr() 函数 
基本 上 ，1 位 引用 计数 法 也 是 在 更 新 指针 的 时 候 进 行内 存 管理 的 。 不 过 它 不 像 以 往 那 样 
指定 要 引用 的 对 象 来 更 新 指针 ， 而 是 通过 复制 某 个 指针 来 更 新 指针 。 进 行 这 项 操作 的 就 是 
copy_ptr() 函数 。 请 看 图 3.8。 


AR Ap 
各 和 


| a i 
(a) (b) 
(WD 一 > UNIQUE 指针 
(0 一 ~ MULTIPLE 指针 


图 3.8 在 1 位 引用 计数 法 中 复制 指针 






























































这 里 更 新 了 之 前 由 A 引用 DD 的 指针 ， 让 其 引用 C。 这 也 可 以 看 成 是 把 由 B 到 C 的 指针 
复制 到 A 了 。 通 过 这 项 操作 ， 两 个 指向 C 的 指针 都 变 成 了 MULTIPLE 指针 。copy_ptr() 天 
数 的 伪 代 码 如 代码 清单 3.14 所 示 。 


代码 清单 3.14: copy_ptr() 函数 
1 | copy_ptr(dest_ptr, src_ptr){ 

















delete_ptr(dest_ptr) 
*dest_ptr = *src_ptr 
set_multiple_tag(dest_ptr) 
if(tag(src_ptr) == UNIQUE) 
set_multiple_tag(src_ptr) 


Daw Nb 


} 





参数 dest_ptr 和 src_ptr 分 别 表示 的 是 目 的 指针 和 被 复制 的 原 指针 。 打 个 比方 ， 在 图 
3.8(a) 中 ，A 的 指针 就 是 目的 指针 ，B 的 指针 就 是 被 复制 的 原 指针 。 

在 copy_ptr() 函数 中 ， 首 先 在 第 2 行 调用 delete_ptr() 了 消 数 ， 尝 试 回收 dest_ptr 引 
用 的 对 象 。 接 下 来 ， 在 第 3 行 把 src_ptr 复制 到 dest_ptr。 然 后 在 第 4 行 到 第 6 行 把 指针 
src_ptr 以 及 dest_ptr 的 标签 更 新 为 MULTIPLE。 

第 5 行 的 tag() 函数 返回 实 参 (指针 ) 的 标签 ， 返回 UNIQUE 或 者 MULTIPLE 的 任意 一 
个 值 。 第 4 行 和 第 6 行 的 set_multiple_tag() 函数 则 把 实 参 ( 指 针 ) 变换 成 MULTIPLE 指针 。 

最 后 只 要 再 把 mutator 这 边 的 update_ptr() 函数 调用 全 换 成 copy_ptr() 函数 ， 就 能 实 
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现 1 位 引用 计数 法 。 
下 面 我 们 将 对 delete_ptr() 函数 进行 说 明 。 


3.6.3 _ delete_ptr() 函数 Ey 


代码 清单 3.15: 1 位 引用 计数 法 的 delete_ptr() 函数 
1 | delete_ptr(ptr){ 
2 if(tag(ptr) == UNIQUE) 

reclaim(*ptr) 


3 
4|} 

















这 个 函数 超级 简单 。 只 有 当 指 针 ptr 的 标签 是 UNIQUE 时 ， 它 才 会 回收 根据 这 个 指针 所 
引用 的 对 象 。 因 为 当 标 签 是 MULTIPLE 时 ， 还 可 能 存在 其 他 引用 这 个 对 象 的 指针 ， 所 以 它 无 
法 回收 对 象 。 


3.6.4 “优点 


1 位 引用 计数 法 的 优点 ， 是 不 容易 出 现 高 速 缓存 缺失 。 

缓存 作为 一 块 存储 空间 ， 比 内 存 的 读 取 速 度 要 快 得 多 。 如 果 要 读 取 的 数据 就 在 缓存 里 的 
话 ， 计 算 机 就 能 进行 高 速 处 理 ; 但 如 果 需 要 的 数据 不 在 缓存 里 ( 即 高 速 缓存 缺失 ) 的 话 ， 就 
需要 读 取 内 存 ， 从 内 存 中 查找 数据 并 将 其 读 取 到 缓存 里 ， 这 样 一 来 就 会 浪费 许多 时 间 。 

也 就 是 说 ， 当 某 个 对 象 A 要 引用 在 内 存 中 离 它 很 远 的 对 象 B 时 ， 以 往 的 引用 计数 法 会 
在 增 减 计数 器 值 的 时 候 读 取 B， 从 而 导致 高 速 缓存 缺失 ， 白 白浪 费 大 把 时 间 。 

1 位 引用 计数 法 就 不 会 这 样 ， 它 不 需要 在 更 新 计数 需 ( 或 者 说 是 标签 ) 的 时 候 读 取 要 引用 
的 对 象 。 各 位 应 该 能 看 明白 吧 ， 在 图 3.8 中 完全 没 读 取 C 和 DD， 指 针 的 复制 过 程 就 完成 了 。 

此 外 ， 因 为 没 必 要 给 计数 器 留 出 多 余 的 空间 ， 所 以 节省 了 内 存 消 耗 量 。 这 也 不 失 为 1 位 
引用 计数 法 的 一 个 优点 。 


3.6.5 ”缺点 


1 位 引用 计数 法 的 缺点 跟 Sticky 引用 计数 法 的 缺点 基本 一 样 。 我 们 必须 想 个 办 法 ,看 看 
怎么 处 理 计数 需 溢 出 的 对 象 。 

据 Clark 和 Green 的 观测 结果 表明 ， 很 多 对 象 的 计数 器 值 都 不 足 2。 如 果 这 个 前 提成 立 ， 
那么 把 计数 器 溢出 的 对 象 放置 不 管 也 肯定 没什么 坏处 。 

然而 ， 我 们 没 法 保证 mutator 能 一 直 顺 利 运行 ， 很 可 能 会 出 现 很 多 对 象 计 数 融 溢出 的 情况 。 

上 述 情况 下 会 生成 大 量 计 数 需 液 出 的 对 象 (也 就 是 内 存 管理 范围 之 外 的 对 象 )， 这 会 给 堆 
带 来 巨大 负担 。 这 样 一 来 ， 我 们 就 很 难保 证 分 块 了 。 
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再 忆 部 分 标记 - 清除 算法 
3.7.1 “什么 是 部 分 标记 一 清除 算法 


之 前 已 经 讲 过 ， 引 用 计数 法 存在 的 一 大 问题 就 是 不 能 回收 循环 的 垃圾 。 这 是 引用 计数 法 
的 一 大 特色 ,用 GC 标记 - 清除 算法 就 不 会 有 这 种 问题 。 那 么 我 们 自然 会 想到 ， 只 要 跟 之 前 
使 用 延迟 引用 计数 法 时 一 样 ， 利 用 GC 标记 - 清除 算法 不 就 好 了 吗 ? 也 就 是 说 ， 可 以 采用 一 
般 情 况 下 执行 引用 计数 法 ,在 某 个 时 刻 启动 GC 标记 - aie 的 方法 。 

然而 ， 这 个 方法 可 以 说 效率 很 低 。 利 用 GC 标记 - 清除 算法 毕竟 是 单纯 为 了 回收 “有 循 
环 引 用 的 垃圾 ”， 而 一 般 来 说 这 种 垃圾 应 该 很 少 ， 单 纯 的 GC - - 清除 算法 又 是 以 全 部 堆 
为 对 象 的 ， 所 以 会 产生 许多 无 用 的 搜索 。 

对 此 ,我们 还 有 个 方法 ， 那 就 是 只 对 “可 能 有 循环 引用 的 对 象 群 ”" 使 用 GC 标记 - 清除 
算法 ， 对 其 他 对 象 进 行内 存 管 理 时 使 用 引用 计数 法 。 像 这 样 只 对 一 部 分 对 象 群 使 用 GC 标记 - 
清除 算法 的 方法 ， 叫 作 “ 部 分 标记 - 清除 算法 ”(Partial Mark & Sweep )。 不 过 它 有 个 特点 ， 执 
行 一 般 的 GC 标记 - 清除 算法 的 目的 是 查找 活动 对 象 ， 而 执行 部 分 标记 - 清除 算法 的 目的 则 
是 查找 非 活 动 对 象 。 接 下 来 我 们 就 为 大 家 介绍 Rafael D. Lins "于 1992 年 研究 出 的 部 分 标记 - 
清除 算法 。 


3.7.2 ”前 提 


在 部 分 标记 - 清除 算法 中 ， 对 象 会 被 涂 成 4 种 不 同 的 颜色 来 进行 管理 。 每 个 颜色 的 含义 
如 下 所 示 。 















































1. 黑 (BLACK) : 绝对 不 是 垃圾 的 对 象 (对 象 产生 时 的 初始 颜色 ) 
2. 白 (WHITE): 绝对 是 垃圾 的 对 象 

灰 (GRAY) : 搜索 完毕 的 对 象 
4. 阴影 (HATCH) : 可 能 是 循环 垃圾 的 对 象 





话 虽 这 么 说 , 事实 上 并 没 办 法 去 给 对 象 涂 颜色 ， 而 是 往 头 中 分 配 2 位 空间 ,然后 用 
00~141 的 值 对 应 这 4 个 颜色 ,以 示 区 分 。 本 书 中 用 obj.color 来 表示 对 象 obj 的 颜色 。 
obj.color 取 BLACK、WHITE、GRAY、HATCH 中 的 任意 一 个 值 。 

为 了 解释 算法 ， 我 们 设 一 个 堆 ， 它 里 面 的 对 象 和 引用 关系 如 图 3.9 所 示 。 
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图 3.9 初始 状态 





有 循环 引用 的 对 象 群 是 ABC 和 DE， 其 中 A 和 D 由 根 引 用 。 此 外 ， 这 里 由 C 和 EE 引用 下 。 

















所 有 对 象 的 颜色 都 还 是 初始 状态 下 的 黑色 。 


3.7.3 dec_ref_cnt() 函数 


























接 下 来 ,通过 mutator 删除 由 根 到 对 象 A 的 引用 。 这 个 引用 是 由 update_ptr() 函数 产 











生 的 。 跟 以 往 的 引用 计数 法 一 样 ， 为 了 将 对 象 A 的 计数 器 减 量 ,在 update_ptr() 函数 中 调 
用 dec_ref_cnt() 函数 。 不 过 在 部 分 标记 - 清除 算法 中 ，dec_ref_cnt() 因数 和 以 往 有 少许 
不 同 。 


代码 清单 3.16: 部 分 标记 -清除 算法 中 的 dec_ref_cnt() 函数 


a 


OOD 


dec_ref_cnt (obj){ 
ob ret..cnte= 
if(obj.ref_cnt == 0) 
delete(obj) 
else if(obj.color != HATCH) 
obj.color = HATCH 
enqueue (obj, $hatch_queue) 
了 





第 2 行 到 第 4 行 的 aec_ref_cnt() 函数 和 以 往 引用 计数 法 中 的 没什么 不 同 。 不 过 ， 如 果 


要 删除 的 对 象 在 队列 中 ,那么 这 里 使 用 的 delete() 函数 也 需要 将 该 对 象 从 队列 中 删除 。 





我 们 该 注意 的 是 第 5 行 之 后 。 算 法 在 对 obj 的 计数 需 进 行 减 量 操作 后 ， 检 查 obj 的 颜色 。 








当 obj 的 颜色 不 是 阴影 的 时 候 ， 算 法 会 将 其 涂 上 阴影 并 追加 到 队列 中 。 当 obj 的 颜色 是 阴影 
的 时 候 ，obj 已 经 被 追加 到 队列 中 了 ， 所 以 程序 什么 都 不 做 。 


dec_ref_cnt() 国 数 执行 之 后 的 推 状态 如 图 3.10 所 示 。 
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图 3.10 dec_ref_cnt() 函数 执行 之 后 


由 根 到 A 的 引用 被 删除 了 ， 指 向 A 的 指针 被 追加 到 了 队列 ($hatch_queue) 之 中 。 此 外 ， 
A 被 涂 上 了 阴影 。 这 个 队列 的 存在 是 为 了 连接 那些 可 能 是 循环 引用 的 一 部 分 的 对 象 。 被 连接 
到 队列 的 对 象 会 被 作为 GC 标记 - 清除 算法 的 对 象 ， 使 得 循环 引用 的 垃圾 被 回收 。 


3.7.4 ”new _obj(0) 函数 


在 部 分 标记 - 清除 算法 中 ， 我 们 不 仅 要 修改 dec_ref_cnt() 函数 ， 也 要 修改 new_obj () 
函数 。 


代码 清单 3.17: 部 分 标记 -清除 算法 中 的 new_obj() 函数 


new_obj(size){ 











请 


obj = pickup_chunk(size) 
if (obj != NULL) 
obj.color = BLACK 
obj.ref_cnt = 1 
return obj 
else if(is_empty($hatch_queue) == FALSE) 


scan_hatch_queue() 


‘OO OO 人 WD 


return new_obj(size) 


上 
© 


else 


上 
2 


allocation_fail() 





上 
ID 


} 





当 可 以 分 配 时 ， 对 象 就 会 被 涂 回 黑色 ， 执 行 这 项 操作 的 是 第 3 行 到 第 6 行 。 当 分 配 无 法 
顺利 进行 的 时 候 ， 程序 会 调查 队列 是 否 为 空 。 当 队列 不 为 空 时 ,程序 会 通过 scan_hatch_ 
queue() 函数 搜索 队列 ， 分 配 分 块 。scan_hatch_queue() 函数 执行 完毕 后 ， 程 序 会 递归 地 
调用 new_obj() 函数 再 次 尝试 分 配 。 

如 果 队 列 为 空 ， 则 分 配 将 会 失败 。 
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3.7.5 scan_hatch_queue() 函数 
scan_hatch_queue() 函数 在 找到 阴影 对 象 前 会 一 直 从 队列 中 取出 对 象 。 


代码 清单 3.18: scan_hatch_queue() 函数 
1 | scan_hatch_queue()T 
obj = dequeue($hatch_queue) 
if(obj.color == HATCH) 
paint_gray (obj) 
scan_gray (obj) 


else if(is_empty($hatch_queue) == FALSE) 


scan_hatch_queue () 





2 
3 
4 
5 
6 collect_white(obj) 
7 
8 
9 


} 


如 果 取 出 的 对 象 obj 被 涂 上 了 阴影 ， 程 序 就 会 将 obj 作为 参数 ， 依 次 调用 paint_gray() 
函数 、scan_gray() 函数 和 collect_white() 隐 数 (第 4 行 到 第 6 行 )， 从 而 通过 这 些 函 数 找 
出 循环 引用 的 垃圾 ， 将 其 回收 。 关 于 各 个 函数 我 们 会 在 之 后 按 顺 序 解说 。 

当 obj 没有 被 涂 上 阴影 时 ， 就 意味 着 obj 没有 形成 循环 引用 。 此 时 程序 对 obj 不 会 进行 
任何 操作 ， 而 是 再 次 调用 scan_hatch_queue() 图 数 (第 8 行 )。 


3.7.6 aint_gray() 函数 

从 scan_hatch_queue() 函数 调用 的 3 个 函数 中 ， 首 先 调用 的 就 是 paint_gray() 函数 。 
它 二 的 事情 非常 简单 ， 只 是 查找 对 象 进行 计数 器 的 减 量 操作 而 已 。 
代码 清单 3.19: paint_gray() 函数 


1 | paint_gray(obj){ 
if(obj.color == (BLACK | HATCH)) 












































obj.color = GRAY 
for(child : children(obj)) 
(*child) .ref_cnt-- 


paint_gray(*child) 





} 


程序 会 把 黑色 或 者 阴影 对 象 涂 成 灰色 ， 对 子 对 象 进行 计数 器 减 量 操 作 ， 并 调用 paint_ 
gray() 函数 。 把 对 象 涂 成 灰色 是 为 了 防止 程序 重复 搜索 。 在 scan_hatch_queue() 函数 中 执 
行 paint_gray() 函数 后 ， 堆 状态 如 图 3.11 所 示 。 
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图 3.11 paint_gray() 函数 执行 之 后 


这 里 通过 paint_gray() 图 数 按 对 象 A、B、C、F 的 顺序 进行 了 搜索 。 下 面 让 我 们 来 详 
细 看 一 下 ， 请 看 图 3.12。 
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3.12 通过 paint_gray() 函数 标记 循环 对 象 





首先 , 在 (a) 中 A 被 涂 成 了 灰色 。 昌 然 程 序 对 计数 器 执行 了 减 量 操作 ， 但 并 不 是 对 A， 
而 是 对 B 的 计数 器 进行 了 减 量 操作 。 下 面 在 b) 中 B 也 被 涂 成 了 灰色 ， 不 过 这 时 程序 并 没有 
对 B 进行 减 量 操作 ， 而 是 对 C 进行 了 减 量 操作 。 在 (c) 中 C 被 涂 成 灰色 时 ， 程 序 对 A 和 下 的 
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计数 器 进行 了 减 量 操作 。 这 样 一 来 ，A、B 、C 的 循环 垃圾 的 计数 器 值 都 变 成 了 0。(d) 是 A、B、 
C、 下 各 个 对 象 搜索 结束 后 的 样子 。 

部 分 标记 - 清除 算法 的 特征 就 是 要 涂 色 的 对 象 和 要 进行 计数 融 减 量 的 对 象 不 是 同一 对 象 ， 
据 此 就 可 以 很 顺利 地 回收 循环 垃圾 。 关 于 这 一 点 ， 我 们 将 在 3.7.10 节 中 再 为 大 家 详细 介绍 。 


3.7.7 _ scan_gray() 函数 
执行 完 paint_gray() 函数 以 后 ， 下 一 个 要 执行 的 就 是 scan_gray() 函数 。 它 会 搜索 灰 
色 对 象 ， 把 计数 需 值 为 0 的 对 象 涂 成 白色 。 


代码 清单 3.20: scan_gray() 函数 
scan_gray (obj){ 
if(obj.color == GRAY) 
if(obj.ref_cnt > 0) 
paint_black (obj) 









































j= 


else 
obj.color = WHITE 
for(child : children(obj)) 
scan_gray (*child) 


OO ORO 人 WD 


} 








打 个 比方 ,在 图 3.11 这 种 情况 下 ， 程 序 会 从 对 象 A 开始 搜索 , 但 是 搜索 的 只 有 灰色 对 
象 。 如 果 对 象 的 计数 需 值 为 0， 程序 就 会 把 这 个 对 象 涂 成 月 色 ， 再 查找 这 We 
也 就 是 说 ，A、B 、C 都 会 被 涂 成 白色 。 计 数 需 值 大 于 0 的 对 象 会 被 paint_black() 函数 处 理 。 
paint_black() 函数 如 代码 清单 3.21 所 示 。 


代码 清单 3.21: paint_black() 函数 
paint_black(obj){ 

2 obj.color = BLACK 

3 for(child : children(obj)) 
4 (*child) .ef_cnt++ 
5 

6 

7 





js 


if((*child).color != BLACK) 
paint_black(*child) 





} 





在 这 里 对 象 的 计数 需 会 被 增 量 ， 被 涂 成 黑色 。paint_blacKk() 函数 在 这 里 进行 的 操作 就 是 : 
从 那些 可 能 被 涂 成 了 灰色 的 有 循环 引用 的 对 象 群 中 ， 找 出 已 知 不 是 垃圾 的 对 象 ， 并 将 其 归 回 
原 处 。 

在 scan_hatch_queue() 困 数 中 执行 完 scan_black() 函数 后 ， 堆 的 状态 如 图 3.13 所 示 。 
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$hatch queue 
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Ex ES 本 oT I 
B C 
3.13 ”scan_gray() 函数 执行 之 后 


不 难看 出 ， 形 成 了 循环 垃圾 的 对 象 A、B、C 被 涂 成 了 白色 ， 而 有 循环 引用 的 非 垃圾 对 象 D、 
E、 下 被 涂 成 了 黑色 。 























剩 下 就 是 通过 collect_white() 


代码 清单 3.22: collect_white() 函数 


1 


OW N 


collect_white(obj)t{ 
if(obj.color == WHITE) 
obj.color = BLACK 
for(child : children(obj)) 
collect_white(*child) 


reclaim(obj) 





} 


collect_white() 函数 


函数 回收 白色 对 象 了 。 


该 函数 只 会 查找 白色 对 象 进行 回收 。 循 环 垃圾 也 可 喜 地 被 回收 了 。 
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3.14 回收 循环 垃圾 

















这 就 是 部 分 标记 - 清除 算法 。 通 











“有 循环 引用 的 垃圾 ”回收 了 。 


过 这 个 算法 就 能 将 引用 计数 法 过 去 一 直 让 人 感到 棘手 的 
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3.7.9 ”限定 搜索 对 象 


部 分 标记 - 清除 算法 的 优点 ， 就 是 把 要 搜索 的 对 象限 定 在 阴影 对 象 及 其 子 对 象 ， 也 就 是 
“可 能 是 循环 垃圾 的 对 象 群 " 中 。 那 么 ， 要 怎么 发 现 这 样 的 对 象 群 呢 ? 
问题 的 关键 就 在 于 循环 垃圾 产生 的 过 程 。 请 看 图 3.15。 
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图 3.15 ”循环 垃圾 产生 的 过 程 


初始 状态 下 根 引用 对 象 A， 对 象 A 引用 对 象 B， 对象 B 引用 对 象 C。 接 下 来 我 们 创建 一 
个 从 对 象 C 到 对 象 A 的 引用 。 在 这 里 就 形成 了 A 一 B 一 C 一 A 的 循环 引用 。 最 后 我 们 删除 
从 根 到 对 象 A 的 引用 。 这 样 一 来 ， 对 象 A 到 C 的 循环 引用 对 象 群 就 成 了 垃圾 。 

像 这 样 ， 当 满足 下 面 两 种 情况 时 ， 就 会 产生 循环 垃圾 。 


1. 产 生 循环 引用 
2. 删除 从 外 部 到 循环 引用 的 引用 


在 此 请 注意 对 象 A 的 计数 器 ， 其 计数 器 值 由 2 变 成 了 1。 

部 分 标记 - 清除 算法 中 用 dec_ref_cnt () 函数 来 检查 这 个 值 。 如 果 对 象 的 计数 器 值 减 量 
后 不 为 0， 说明 这 个 对 象 可 能 是 循环 引用 的 一 份子 。 这 时 会 先 让 这 个 对 象 连接 到 队列 ， 以 方 
便 之 后 搜索 它 。 


3.7.10 ”paint_gray() 函数 的 要 点 
关于 部 分 标记 - 清除 算法 ,我 们 还 有 一 个 要 点 要 说 ， 那 就 是 paint_gray() 函数 。 在 
paint_gray() 函数 中 ,参数 obj 为 黑色 或 阴影 时 会 把 obj 涂 成 灰色 ， 然 后 对 obj 的 子 对 象 
人 并 递归 地 调用 paint_gray() 函数 。obj 自身 的 计数 器 并 没有 被 执行 减 量 。 
这 点 非常 重要 。 
如 果 在 这 里 不 对 obj 子 对 象 的 计数 顺 执 行 减 量 ， 而 是 对 obj 的 计数 顺 执 行 减 量 ， 会 怎么 
样 呢 ? 我 们 将 paint_gray() 函数 稍微 变换 一 下 ， 变 换 成 badq_paint_gray() 函数 ， 看 看 情 
况 会 如 何 。 请 看 代码 清单 3.23。 
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代码 清单 3.23: bad_paint_gray() 函数 
1 | bad_paint_gray (obj){ 
if(obj.color == (BLACK | HATCH)) 
obj .zef_cnt== 
obj.color = GRAY 
for(child : children(obj)) 
bad_paint_gray(*child) 





OW DD 


} 





事实 上 用 bad_paint_gray() 函数 也 能 回收 循环 垃圾 。 这 是 因为 仅 改变 对 计数 需 进 行 减 
量 操 作 的 时 刻 ， 最 后 就 能 将 循环 垃圾 的 计数 需 值 全 部 变 成 0。 不 过 在 如 图 3.16 所 示 的 状况 下 ， 


A 


bad_paint_gray() 国 数 无 法 顺利 运行 。 
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图 3.16 bad_paint_gray() 函数 无 法 顺利 运行 的 例子 


bad_paint_gray() 困 数 涂改 对 象 并 对 计数 顺 进 行 减 量 操作 的 情况 如 图 3.17 所 示 。 
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图 3.17 bad_paint_gray() 的 执行 过 程 
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当 函 数 搜索 完 对 象 C 时 ， 对 象 A 到 C 都 会 被 涂 成 灰色 ， 计 数 器 值 变 为 0。 接 下 来 ， 通 过 
scan_gray() 函数 再 次 从 对 象 A 开始 搜索 ， 不 过 因为 对 象 A 的 计数 器 值 已 经 变 成 了 0， 所 以 
被 涂 成 了 白色 。 当 然 ， 对象 B 和 C 也 是 如 此 。 然 后 根据 collect_white() 函数 ， 对 象 A 到 
C 被 辨认 为 垃圾 并 回收 。 

为 什么 会 发 生 这 种 事情 呢 ? 这 是 因为 bad_paint_gray() 琢 数 突然 把 已 经 进入 队列 的 对 
象 (也 就 是 对 象 A ) 的 计数 需 减 量 了 。 在 这 个 阶段 ， 程 序 无 法 判别 对 象 A 是 否 形成 了 循环 引用 。 
只 能 从 A 找到 B， 然 后 再 查找 C， 再 由 C 回 到 A， 才 能 知道 A 到 C 是 循环 的 。 

因此 在 部 分 标记 - 清除 算法 中 ，paint_gray() 函数 不 是 在 搜索 A 的 时 候 就 首先 对 A 的 
计数 器 进行 减 量 操作 的 ， 而 是 从 A 的 子 对 象 ， 也 就 是 B 的 计数 器 开始 进行 减 量 操作 的 。 在 
这 种 稍 不 经 心 就 会 看 漏 的 地 方 ， 居 然 隐藏 着 这 么 重要 的 关键 点 呢 。 
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图 3.18 paint_gray() 函数 的 执行 过 程 



























































NH 


Ra 











如 图 3.18 所 示 ， 当 搜索 完 C 时 对 象 A 的 计数 絮 值 为 1， 所 以 A 不 能 被 回收 。 在 这 之 后 ， 
paint_black() 函数 会 把 对 象 A 到 C 全 部 涂 黑 ， 也 会 对 B 和 C 的 计数 器 进行 增 量 操作 ， 这 
样 对 象 就 完全 回 到 了 原始 的 状态 。 


3.7.11 ”部 分 标记 一 清除 算法 的 局 限 性 


然而 ， 部 分 标记 - 清除 算法 并 不 是 完美 的 ， 因 为 从 队列 搜索 对 象 所 付出 的 成 本 太 大 了 。 
被 队列 记录 的 对 象 毕 竟 是 候选 垃圾 ， 所 以 要 搜索 的 对 象 绝 对 不 在 少数 。 这 个 算法 总 计 需 要 
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查找 3 次 对 象 ， 也 就 是 说 需要 对 从 队列 取出 的 阴影 对 象 分 别 执行 1 次 mark_gray() 函数 、 
scan_gray() 国 数 以 及 collect_white() 函数 。 这 大 大 增加 了 内 存 管理 所 花费 的 时 间 。 
此 外 ， 搜 索 对 象 还 害 得 引用 计数 法 的 一 大 优点 一 一 最 大 和 暂停 时 间 短 荡然 无 存 。 














GC 复制 算法 (Copying GC ) 是 Marvin L. Minsky 在 1963 年 研究 出 来 的 算法 。 说 
得 简单 点 ， 就 是 只 把 某 个 空间 里 的 活动 对 象 复制 到 其 他 空间 ， 把 原 空间 里 的 所 有 对 象 都 回收 
掉 。 这 是 一 个 相当 大 胆 的 算法 。 在 此 ， 我 们 将 复制 活动 对 象 的 原 空间 称 为 From 空间 ,将 
二 风 二 的 半 s 间 称 为 To 空间 。 


Wen. 


Em 
Rf done! 


什么 是 6C 复 制 算法 


本 童 首先 会 为 大 家 介绍 Robert R. Fenichel 与 Jerome C. Yochelson 研究 出 来 的 GC 复制 
算法 。 

GC 复制 算法 是 利用 From 空间 进行 分 配 的 。 当 From 空间 被 完全 占 满 时 ，GC 会 将 活动 
对 象 全 部 复制 到 To 空间 。 当 复制 完成 后 ， 该 算法 会 把 From 空间 和 To 空间 互 换 ，GC 也 就 结 
束 了 。From 空间 和 To 空间 大 小 必须 一 致 。 这 是 为 了 保证 能 把 From 空间 中 的 所 有 活动 对 象 
都 收纳 到 To 空间 里 。GC 复制 算法 的 概要 如 图 4.1 所 示 。 
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图 4.1 
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From 空间 


«7 执行 mutator 


To 空间 


本 7 执行 GC 


To 空间 


GC 复制 算法 的 概要 


我 们 一 起 来 看 一 下 执行 GC 复制 算法 的 copying() 函数 吧 。 


代码 清单 4.1: copying() 函数 


[uy 


copying(){ 
$free = $to_start 
for(r : $roots) 


*r = COPpY(*r) 


swap($from_ start, $to_start) 
} 





让 wm D 





$free 是 指示 分 块 开头 的 变量 。 首 先 在 第 2 行将 $free 设置 在 To 空间 的 开头 ， 然 后 在 
第 3 行 、 第 4 行 复制 能 从 根 引 用 的 对 象 。copy () 函数 将 作为 参数 传递 的 对 象 *r 复制 的 同时 ， 








也 将 其 子 对 象 进行 递归 复制 。 复制 结束 后 返 
空间 的 对 象 。 





回 指 针 ， 这 里 返回 的 指针 指向 的 是 *r 所 在 的 新 





在 GC 复制 算法 中 ,在 GC 结束 时 ， 


原 空间 的 对 象 会 作为 垃圾 被 回收 。 因 此 ， 由 根 指向 
原 空 间 对 象 的 指针 也 会 被 重 写 成 指向 返回 值 的 新 对 象 的 指针 。 


最 后 在 第 6 行 把 From 空间 和 To 空间 互 换 ，GC 就 结束 了 。 





GC 复制 算法 的 关键 当然 要 数 copy() 隆 


函数 了 。 我 们 来 详细 看 看 它 吧 。 


4.1.1 ”Copy() 函数 
copy() 函数 将 作为 参数 给 出 的 对 象 复制 ， 再 递归 复制 其 子 对 象 。 
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代码 清单 4.2: copy() 函数 
copy(obj)T 


2 


2| if(obj.tag != COPIED) 

3 copy_data($free, obj, obj.size) 
4 obj.tag = COPIED 

5 obj.forwarding = $free 

6 $free += obj.size 

7 

8 for(child : children(obj.forwarding)) 
9 *child = copy(*child) 

0 

四 二 return obj.forwarding 

12. | 寺 








首先 函数 在 第 2 行 检 查 obj 的 复制 是 否 已 完成 ， 在 这 里 出 现 的 obj.tag 是 一 个 域 ， 表 
示 obj 的 复制 是 否 完成 。 如 果 obj .tag == COPIED， 则 obj 的 复制 已 经 完成 。 不 过 这 不 是 
什么 特别 的 域 。 我 们 只 是 为 了 容易 把 它 和 已 有 的 域 区 分 开 ， 而 特意 给 它 起 了 个 名 字 而 已 。 这 
里 的 obj .tag 就 是 obj.fieldl 的 别名 。 

如 果 obj 尚未 被 复制 ， 则 函数 会 在 第 3 行 到 第 9 行 复制 obj， 返 回 指向 新 空间 对 象 的 指针 。 

如 果 obj 的 复制 已 经 完成 ， 则 函数 会 返回 新 空间 对 象 的 地 址 。 

下 面 我 们 将 解说 第 3 行 到 第 9 行 。 首 先 在 第 3 行 用 copy_data() 函数 将 obj 真正 “复制 ” 
到 $free 指示 的 空间 。 使 用 copy_data() 函数 后 对 象 的 复制 情况 如 图 4.2 所 示 。 
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4.2 ”通过 copy_datal() 函数 复制 对 象 
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如 图 4.2 所 示 ， 对 象 A 被 复制 ， 生 成 了 A'。 
I 4.2。 在 第 3 行 的 copy_data() 函数 中 ， 新 空间 是 $free， 原 空间 
， 大 小 是 obj .size。 第 3 行 执 行 完毕 时 从 新 空间 的 对 象 指出 的 指针 还 指向 From 空间 ， 











在 第 4 行 给 obj .tag 贴 上 COPIED 这 个 标签 。 这 样 一 来 ， 即 使 有 很 多 个 指向 obj 的 指针 ， 
obj 也 不 会 被 复制 很 多 次 。 

在 第 5 行 把 指向 新 空间 对 象 的 指针 放 在 obj .forwarding 里 。 像 这 样 的 指针 叫 作 “forwarding 
指针 ”。 之 后 当 找 到 指向 原 空 间 对 象 的 指针 时 ,需要 把 找到 的 指针 换 到 新 空间 ，forwarding 指针 
正 是 为 此 准备 的 。 另 外 ， 这 个 叫 作 forwarding 的 域 也 同样 是 个 普通 的 域 ， 这 里 的 forwarding 
是 field2 的 别名 。 

COPIED 标签 和 forwarding 指针 如 图 4.3 所 示 。 
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4.3 定义 COPIED 标 签 和 设置 forwarding 指针 





请 注意 图 4.3 中 的 对 象 A。tag 域 中 添上 了 一 个 复 选 标记 。 在 这 里 它 表 示 的 是 COPIED 标签 。 
此 外 ，forwarding 域 中 设置 了 指向 A 的 指针 。 这 就 是 forwarding 指针 。 

我 们 再 次 回 到 代码 清单 4.2， 在 第 6 行 中 按照 obj 的 长 度 向 前 移动 $free， 在 第 8 行 和 
第 9 行 把 新 空间 对 象 的 子 对 象 作 为 参数 ， 递 归 调 用 copy() 函数 。 

因为 copy() 函数 会 返回 指向 新 空间 的 指针 ， 所 以 会 把 指向 子 对 象 的 引用 重 写 为 这 个 新 
的 指针 。 这 样 一 来 ， 从 To 空间 指向 From 空间 的 指针 就 全 部 指向 To 空间 了 。 

GC 全 部 执行 完毕 后 的 状态 如 图 4.4 所 示 。 
































From 空间 






































To 空间 

















图 4.4 copying() 函数 执行 完毕 后 
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图 4.2(a) 中 的 活动 对 象 A、C、D 保持 着 原 有 的 引用 关系 被 从 From 空间 复制 到 了 To 空间 。 
此 外 ， 从 根 指向 A 的 指针 也 被 换 成 了 A'。 留 在 From 空间 里 的 对 象 A 到 DD 都 被 回收 了 。 

在 此 要 实现 这 个 方法 有 2 个 条 件 。 首 先 每 个 对 象 都 至 少 要 有 2 个 域 , 分 别 用 作 COPIED 
标签 和 forwarding 指针 。 大 多 数 处 理 系统 应 该 都 能 满足 这 个 条 件 。 接 下 来 ，COPIED 标签 为 
了 挪用 obj 中 的 域 ， 必 须 选 1 个 mutator 绝对 不 会 用 到 的 值 。 这 要 花 些 功夫 。 举 个 例子 ， 我 
们 可 以 空 着 mutator， 不 利用 最 高 有 效 位 ， 设 置 最 高 有 效 位 的 值 为 COPIED。 


4.1.2 new_obj() 函数 











跟 GC 标记 - 清除 算法 等 算法 不 同 ，GC 复制 算法 的 分 配 过 程 非常 简单 。 

代码 清单 4.3: new_obj() 函数 

1 | new_obj(size){ 

2 if($free + size > $from start + HEAP_SIZE/2) 

3 copying() 

4 if($free + size > $from start + HEAP_SIZE/2) 

5 allocation_fail() 

6 

区 obj = $free 

8 obj.size = size 

9 $free += size 

10 return obj 

二 | 全 





在 GC 复制 算法 中 ， 请 注意 GC 完成 后 只 有 1 个 分 块 的 内 存 空间 。 在 每 次 分 配 时 ， 
把 所 申请 大 小 的 内 存 空间 从 这 个 分 块 中 分 割 出 来 给 mutator 就 行 了 。 也 就 是 说 ， Ws 
跟 GC 标记 - 清除 算法 中 的 分 配 不 同 ,不 需要 遍历 空 闪 链表 。 
这 里 有 一 点 应 引起 注意 , 在 GC 复制 算法 中 ，HEAP_SIZE 表示 的 是 把 From 空间 和 To 空 
间 加 起 来 的 大 小 。 也 就 是 说 ，From 空间 和 To 空间 的 大 小 一 样 ， 都 是 HEAP_SIZE 的 一 半 。 

如 果 分 块 的 大 小 不 够 ,也 就 是 说 分 块 小 于 所 申请 的 大 小 的 时 候 ， 比 起 启动 GC， 首 先 应 
分 配 足够 大 的 分 块 。 不 然 一 旦 分 块 大 小 不 够 ， 分 配 就 会 失败 。 

如 果 分 块 足够 大 , 那么 程序 就 会 把 size 大 小 的 空间 从 这 个 分 块 中 分 割 出 来 ， 交 给 
mutator。 不 过 别 忘 了 还 得 把 $free 移动 size 个 长 度 。 


















































4.1 什么 是 GC 复 制 算 法 





4.1.3 ”执行 过 程 

我 们 通过 别 的 例子 来 详细 看 看 GC 复制 算法 。 请 大 家 特别 注意 对 象 被 复制 的 顺序 。 我 们 
假设 堆 里 对 象 的 配置 如 图 4.5 所 示 。 为 了 给 GC 做 准备 ， 这 里 事先 将 $free 指针 指向 To 空 
间 的 开头 。 






































































































































To 空间 








$free .一 


4.5 初始 状态 





假设 就 以 这 种 状态 开始 GCC。 首先 是 从 根 直 接 引 用 的 对 象 B 和 G，B 先 被 复制 到 了 To 空间 。 
B 被 复制 后 的 堆 状态 如 图 4.6 所 示 。 


































































































$free 









































To 空间 








4.6 B 被 复制 之 后 


在 此 我 们 将 B 被 复制 后 生成 的 对 象 称 为 B 。 我 们 看 图 4.6 中 的 B，fieldl 已 经 打上 了 复 
制 完成 的 标签 ，field2 里 放 了 一 个 指向 B 的 forwarding 指针 。 

但 是 ， 这 里 只 把 B 复制 了 过 来 ， 它 的 子 对 象 A 还 在 From 空间 里 。 下 面 我 们 要 把 这 个 A 
复制 到 To 空间 里 。 








Cal 
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To 空间 





$free 。 





4.7 A 被 复制 之 后 





这 次 才 可 以 说 在 真正 意义 上 复制 了 B( 图 4.7)。 因 为 A 没有 子 对 象 ， 所 以 对 A 的 复制 也 
就 完成 了 。 

接 下 来 ， 我 们 要 复制 和 B 一 样 从 根 引 用 的 G， 以 及 其 子 对 象 Ek。 虽然 B 也 是 G 的 子 对 象 ， 
不 过 因为 已 经 复制 完 B 了 ， 所 以 只 要 把 从 G 指向 B 的 指针 换 到 B 上 就 行 了 。 

最 后 只 要 把 From 空间 和 To 空间 互 换 ，GC 就 结束 了 。GC 结束 时 堆 的 状态 如 图 4.8 所 示 。 
我 们 在 以 后 的 章节 里 还 会 引用 这 张 图 ， 请 务必 牢记 。 











































































































From 空间 








$free 。 


图 4.8 ”GC 结束 后 


当然 了 ， 对 象 C、D 、 因为 没 法 从 根 查 找 ， 所 以 会 被 回收 。 

在 这 里 程序 是 以 B、A、G、E 的 顺序 搜索 对 象 的 。 不 知 大 家 发 现 了 没有 ， 这 是 我 们 在 第 
2 章 的 专栏 中 提 到 的 深度 优先 搜索 。 这 跟 广 度 优先 搜索 有 什么 不 同 呢 ? 关于 这 一 点 ,我 们 会 
在 4.3.3 节 和 4.4.3 节 中 为 大 家 说 明 。 








4.2.1 ”优秀 的 吞吐 量 


GC 标记 - 清除 算法 消耗 的 吞吐 量 是 搜索 活动 对 象 (标记 阶段 ) 所 花费 的 时 间 和 搜索 整体 
堆 ( 清 除 阶段 ) 所 花费 的 时 间 之 和 。 

另 一 方面 ， 因 为 GC 复制 算法 只 搜索 并 复制 活动 对 象 ， 所 以 跟 一 般 的 GC 标记 - 清除 算 
法 相 比 ， 它 能 在 较 短 时 间 内 完成 GC。 也 就 是 说 ， 其 否 吐 量 优 秀 。 

尤其 是 堆 越 大 ， 差 距 越 明显 。GC 标记 - 清除 算法 在 清除 阶段 所 花费 的 时 间 会 不 断 增加 ， 
但 GC 复制 算法 就 不 会 产生 这 种 消耗 。 毕 况 它 消耗 的 时 间 是 与 活动 对 象 的 数量 成 比例 的 。 


4.2.2 ”可 实现 高 速 分 配 


GC 复制 算法 不 使 用 空闲 链表 。 这 是 因为 分 块 是 一 个 连续 的 内 存 空间 。 因 此 ， 调 查 这 个 
分 块 的 大 小 ， 只 要 这 个 分 块 大 小 不 小 于 所 申请 的 大 小 ， 那 么 移动 $free 指针 就 可 以 进行 分 配 了 。 

比 起 GC 标记 - 清除 算法 和 引用 计数 法 等 使 用 空闲 链表 的 分 配 ，GC 复制 算法 明显 快 得 多 。 
大 家 想 一 下 ,使 用 空闲 链表 时 为 了 找到 满足 要 求 的 分 块 ， 需 要 遍历 空 闻 链表 对 吧 ? 最 坏 的 
情况 就 是 我 们 不 得 不 从 空 闪 链表 中 取出 最 后 一 个 分 块 ， 这 样 就 要 花 大 把 时 间 把 所 有 分 块 都 
调查 一 遍 。 


4.2.3 “不 会 发 生 碎片 化 


请 再 看 一 下 图 4.8。 基 于 算法 性 质 ， 活 动 对 象 被 集中 安排 在 From 空间 的 开头 对 吧 。 像 这 
样 把 对 象 重新 集中 ， 放 在 堆 的 一 端的 行为 就 叫 作 压缩 。 在 GC 复制 算法 中 ， 每 次 运行 GC 时 
都 会 执行 压缩 。 

因此 GC 复制 算法 有 个 非常 优秀 的 特点 ， 就 是 不 会 发 生 碎片 化 。 也 就 是 说 ， 可 以 安排 分 
块 允许 范围 内 大 小 的 对 象 。 

另 一 方面 , 在 GC 标记 - 清除 算法 等 GC 算法 中 ， 一 且 安 排 了 对 象 ， 原 则 上 就 不 能 再 移 
动 它 了 ， 所 以 多 多 少 少 会 产生 碎片 化 了。 


4.2.4 “与 缓存 兼容 


不 知 各 位 注意 到 了 没有 , 在 GC 复制 算法 中 有 引用 关系 的 对 象 会 被 安排 在 堆 里 离 彼此 较 
近 的 位 置 。 请 再 看 一 下 图 4.8。B 引用 A'，G' 引 用 EE'， 图 中 按照 B、A'、G 、E 的 顺序 排列 。 
这 种 情况 有 一 个 优点 ， 那 就 是 mutator 执行 速度 极 快 。 近 来 很 多 CPU 都 通过 缓存 来 高 速 










































































不 过 ,在 GC 标记 -清除 算法 中 也 可 以 进行 压缩 。 当 碎片 化 严重 时 ， 可 以 通过 压缩 来 消除 碎片 化 。 
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读 取 位 置 较 近 的 对 象 (1.9.4 节 ) 这 也 是 借助 压缩 来 完成 的 ， 通 过 压缩 来 把 有 引用 关系 的 对 
象 安排 在 堆 中 较 近 的 位 置 。 


4.3 


4.3.1 _ 堆 使 用 效率 低下 


GC 复制 算法 把 堆 二 等 分 通常 只 能 利用 其 中 的 一 半 来 安排 对 象 。 也 就 是 说 ， 只 有 一 半 
堆 能 被 使 用 。 相 比 其 他 能 使 用 整个 堆 的 GC 算法 而 言 ， 可 以 说 这 是 GC 复制 算法 的 一 个 重大 
的 缺陷 。 
通过 搭配 使 用 GC 复制 算法 和 GC 标记 - 清除 算法 可 以 改善 这 个 缺点 。 关 于 这 一 点 ,我 
们 会 在 4.6 节 为 大 家 详细 介绍 。 


4.3.2 “不 兼容 保守 式 GC 算法 


我 们 在 第 2 章 中 提 到 过 ，GC 标记 - 清除 算法 有 着 跟 保 守 式 GC 算法 相 兼容 的 优点 。 
为 GC 标记 - 清除 算法 不 用 移动 对 象 。 

另 一 方面 ，GC 复制 算法 必须 移动 对 象 重 写 指针 ， 所 以 有 着 跟 保 守 式 GC 算法 不 相 容 的 
性 质 。 虽 然 有 限制 条 件 ， 不 过 GC 复制 算法 和 保守 式 GC 算法 可 以 进行 组 合 。 关 于 这 点 我 们 
在 第 6 章 会 为 大 家 进行 解说 。 


4.3.3 ”递归 调用 函数 


在 这 里 介绍 的 算法 中 ,复制 某 个 对 象 时 要 递归 复制 它 的 子 对 象 。 因 此 在 每 次 进行 复制 的 
时 候 都 要 调用 函数 ， 由 此 带 来 的 额外 负担 不 容 忽视 。 大 家 都 知道 比 起 这 种 递归 算法 ， 和 迭代 算 
法 更 能 高 速 地 执行 后。 

此 外 ， 因 为 在 每 次 递归 调用 时 都 会 消耗 栈 ， 所 以 还 有 栈 溢出 的 可 能 。 

为 了 消除 这 个 缺点 ,我们 会 在 下 一 节 中 为 大 家 介绍 Cheney 的 GC 复制 算法 一 一 迭代 进 
行 复制 的 算法 。 


起 Cheney 的 GC 复制 算法 


C.J. Cheney 于 1970 年 研究 出 了 GC 算法 由。 相 比 Fenichel 和 Yochelson 的 GC 复制 算法 ， 
Cheney 的 GC 复制 算法 不 是 递归 地 ， 而 是 迭代 地 进行 复制 。 
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代码 清单 4.4: Cheney 的 GC 复制 算法 


1 | copying O){ 

2 scan = $free = $to_start 

3 for(r : $roots) 

4 *r = COpYy(*r) 

5 

6 while(scan != $free) 

7 for(child : children(scan)) 
8 *child = copy(*child) 

9 scan += scan.size 
10 
J swap($from_start, $to_start) 
12: | 二 








在 第 2 行将 scan 和 $free 的 两 个 指针 初始 化 。scan 是 用 于 搜索 复制 完成 的 对 象 的 指针 。 
$free 是 指向 分 块 开头 的 指针 ， 跟 我 们 在 前 面 介 绍 的 GC 复制 算法 中 的 用 法 一 样 。 

首先 复制 的 是 直接 从 根 引 用 的 对 象 ， 用 到 的 是 第 3 行 和 第 4 行 。 在 第 6 行 到 第 9 行 搜索 
复制 完成 的 对 象 ， 迭 代 复 制 其 子 对 象 。 最 后 把 From 空间 和 To 空间 互 换 就 结束 了 。 Cheney 
的 GC 复制 算法 中 的 关键 点 仍 是 copy() 函数 。 


4.4.1 ”COPyY() 函数 


代码 清单 4.5: Cheney 的 copy() 函数 
copy (obj){ 
if(is_pointer_to_heap(obj.forwarding，$to_start) == FALSE) 









































2 


copy_data($free, obj, obj.size) 
obj.forwarding = $free 
$free += obj.size 

return obj.forwarding 


} 


A a 人 WwW DD 














首先 在 第 2 行 检查 参数 obj 是 不 是 已 经 复制 完毕 了 。 

对 于 is_pointer_to_heap(obj.forwarding，$to_start)， 如 果 obj.forwarding 是 指 
向 To 空间 的 指针 则 返回 TRUE， 如 果 不 是 ( 即 非 指针 或 指向 From 空间 的 指针 ) 则 返回 FALSE。 

在 第 3 行 复 制 对 象 , 在 第 4 行 对 forwarding 指针 进行 设 定 。 forwarding 指针 利用 的 是 
fieldl。 

显而易见 ， 在 Fenichel 和 Yochelson 的 GC 复制 算法 中 也 有 进行 复制 对 象 和 设 定 forwarding 
指针 的 操作 。 然 而 Cheney 的 GC 复制 算法 中 没有 用 到 COPIED 标签 。 在 Fenichel 和 Yochelson 
的 GC 复制 算法 中 用 COPIED 标签 来 区 分 复制 完成 或 未 完成 。 在 Cheney 的 GC 复制 算法 中 使 用 
的 则 是 forwarding 指针 。 
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那么 怎么 用 forwarding 指针 来 判断 对 象 是 否 复制 完毕 呢 ? 请 大 家 试 着 想象 一 下 ，GC 没 
复制 的 对 象 ， 其 指针 指向 哪里 呢 ? 当然 是 指 着 From 空间 某 处 的 对 象 唆 。 反 过 来 就 可 以 这 样 
判断 : 哪些 对 象 有 着 指向 To 空间 某 处 的 指针 ， 哪 些 对 象 就 已 经 复制 完毕 了 。 也 就 是 说 ， 可 
知 obj.fieldl 指向 To 空间 的 对 象 obj 已 经 复制 完毕 了 。 


4.4.2 ”执行 过 程 


光 用 文字 和 伪 代 码 比较 难 理 解 ， 我 们 来 结合 图 片 详细 看 一 下 吧 。 除 了 引入 了 scan 指针 
之 外 ， 初 始 状态 和 图 4.5 是 一 样 的 。 














































































































From 空 间 




















To 空间 





4.9 初始 状态 





在 Cheney 的 算法 中 ， 首 先 复 制 所 有 从 根 直接 引用 的 对 象 ， 在 这 里 就 是 复制 B 和 C。 


















































































































































To 空间 











图 4.10 复制 B 和 G 之 后 
在 这 时 ，scan 仍然 指 着 To 空间 的 开头 ，$free 从 To 空间 的 开头 向 右 移 动 了 B 和 G 个 长 度 。 


关键 是 scan 每 次 对 复制 完成 的 对 象 进行 搜索 时 ， 以 及 $free 每 次 对 没 复制 的 对 象 进行 复制 时 ， 
都 会 向 右 移 动 。 剩 下 就 是 重复 搜索 对 象 和 复制 ， 直 到 scan 和 $free 一 致 。 下 面 进行 对 B 的 搜索 。 
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AP 


From 空间 










































































To 空间 














图 4.11 搜索 B' 之 后 





搜索 B， 然 后 把 被 B 引用 的 A 复制 到 了 To 空间 ， 同 时 把 scan 和 $free 分 别 向 右 移 动 了 。 
下 面 该 搜索 的 是 G。 搜 索 G 后 , 下 被 复制 到 了 To 空间 ， 从 G 指向 B 的 指针 被 换 到 了 B'。 

下 面 该 搜索 A 和 下 了 ,不 过 它们 都 没有 子 对 象 ， 所 以 即使 搜索 了 也 不 能 进行 复制 。 因 为 
在 下 搜索 完成 时 scan 和 $free 一 致 ， 所 以 最 后 只 要 把 From 空间 和 To 空间 互 换 ，GC 就 结束 了 。 


















































































































































From 空间 























图 4.12 ”GC 结束 后 


接 下 来 按 B、G、A、E 的 顺序 来 搜索 对 象 。Fenichel 和 Yochelson 的 GC 复制 算法 采用 
的 是 深度 优先 搜索 ， 而 Cheney 的 复制 算法 采用 的 则 是 广度 优先 搜索 。 


4.4.3 ”被 隐藏 的 队列 


广度 优先 搜索 需要 先 人 先 出 (FIFO ) 结 构 的 队列 ， 即 把 该 搜索 的 对 象 保持 在 队列 中 ， 一 
边 取 出 一 边 进行 搜索 。 

可 是 代码 清单 4.4 和 代码 清单 4.5 里 并 没有 出 现 诸 如 此 类 的 队列 。 那 么 我 们 要 怎么 进行 
广度 优先 搜索 呢 ? 
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举 个 例子 ， 请 看 图 4.10， 这 时 还 没 被 搜索 的 对 象 是 B 和 G'。 

那么 图 4.11 又 如 何 呢 ? G 和 和 还 没 被 搜索 ，B 已 经 搜索 完毕 了 。 

细心 的 读者 应 该 已 经 注意 到 了 吧 。 实 际 上 scan 和 $free 之 间 的 堆 变 成 了 队列 。scan 
左边 是 已 经 搜索 完毕 的 对 象 空间 。 也 就 是 说 ，$free 每 次 向 右 移动 ， 队 列 里 就 会 追加 对 象 ， 
scan 每 次 向 右 移 动 ， 都 会 有 对 象 被 取出 和 搜索 。 这 样 一 来 就 满足 了 先入 先 出 队列 的 条 件 ， 
即 把 先 追 加 的 对 象 先 取出 。 

像 这 样 把 堆 兼 用 作 队 列 ， 正 是 Cheney 算法 的 一 大 优点 。 不 用 特意 为 队列 留 出 多 余 的 内 
存 空间 就 能 进行 搜索 。 


4.4.4 优点 


Fenichel 和 Yochelson 的 GC 复制 算法 是 递归 算法 ,而 Cheney 的 GC 复制 算法 是 迭代 算 
法 ， 因 此 它 可 以 抑制 调用 函数 的 额外 负担 和 栈 的 消耗 。 特 别 是 拿 堆 用 作 队 列 ， 省 去 了 用 于 搜 
索 的 内 存 空 间 这 一 点 ， 实 在 是 令 人 赞叹 。 


4.4.5 ”缺点 


请 大 家 回忆 一 下 ,在 Fenichel 和 Yochelson 的 GC 复制 算法 中 ， 具 有 引用 关系 的 对 象 是 
相 邻 的 ， 因 此 才能 充分 利用 缓存 的 便利 。 另 一 方面 ， 就 像 我 们 在 图 4.12 中 看 到 的 那样 ， 在 
Cheney 的 GC 复制 算法 中 ， 有 引用 关系 的 对 象 ， 也 就 是 G 和正 ，B 和 A 并 不 相 邻 。 

因此 我 们 没 法 说 Cheney 的 GC 复制 算法 兼容 缓存 ， 只 能 说 它 比 GC 标记 - 清除 算法 和 引 
用 计数 法 要 好 一 些 而 已 。 

下 一 节 中 我 们 将 会 为 大 家 介绍 近似 深度 优先 搜索 的 方法 ， 该 方法 对 Cheney 的 CC 复制 
算法 进行 了 改善 。 


月 项 近 似 深度 优先 搜索 方法 


Cheney 的 GC 复制 算法 由 于 在 搜索 对 象 上 使 用 了 广度 优先 搜索 ， 因 此 存在 “ 没 法 沾 缓存 
的 光 ” 的 缺点 。 

下 面 我 们 将 为 大 家 介绍 Paul R. Wilson 、Michael S. Lam 和 Thomas G. Moher 于 1991 年 提 
出 的 近似 深度 优先 搜索 法 。 这 个 方法 虽然 只 是 近似 深度 优先 搜索 ， 不 过 这 样 一 来 就 能 通过 深 
度 优先 搜索 执行 GC 复制 算法 了 。 


4.5.1 ”Cheney 的 GC 复制 算法 (复习 ) 
首先 为 了 比较 两 者 ， 我们 先 来 看 一 下 Cheney 的 GC 复制 算法 。 以 图 4.13 这 样 的 引用 关 
系 为 例 ， 假 设 这 里 所 有 的 对 象 都 是 2 个 字 。 
























































































































































4.5 近似 深度 优先 搜索 方法 








图 4.13 对象 间 的 引用 关系 


执行 Cheney 的 GC 复制 算法 时 放置 各 个 对 象 的 “页 面 ” 如 图 4.14 所 示 ， 据 此 我 们 就 知道 


了 各 对 象 在 内 存 里 的 配置 情况 。 































































































图 4.14 Cheney 的 GC 复制 算法 中 各 个 对 象 的 配置 











各 页 面 右上 角 的 数字 表示 的 是 该 页 的 编号 。 不 过 各 页 面 的 容量 只 有 6 个 字 ， 
能 放下 3 个 对 象 。 
在 Cheney 的 GC 复制 算法 中 , 为 了 能 按 A、B、C、D、E、F、G……… 的 顺序 搜索 对 象 ， 
对 象 的 配置 如 上 图 所 示 。 
这 里 需要 大 家 注意 的 是 各 页 面 中 的 对 象 间 的 引用 关系 。 不 难看 出 ，A 和 被 A 引用 的 B、 
是 相 邻 摆 放 的 。 这 就 形成 了 我 们 之 前 在 第 1 章 中 提 过 的 访问 局 部 性 的 理想 状态 。 
不 过 ， 其 他 的 对 象 距离 有 引用 关系 的 对 象 较 远 。 这 样 一 来 ， 就 降低 了 本 来 很 有 可 能 被 连 
续 读 取 的 对 象 同时 位 于 缓存 中 的 可 能 性 ， 降 低 了 缓存 命 中 率 。 
在 第 0 页 中 ，A 和 其 引用 的 B、C 已 经 配置 好 了 ， 形 成 了 理想 的 状态 。 
不 过 ， 在 其 他 的 第 1 页 至 第 4 页 中 ,同一 页 面 里 的 对 象 间 都 没有 引用 关系 。 因 此 每 次 i 
问 这 些 对 象 时 ， 都 要 浪费 时 间 去 从 内 存 上 读 取 包含 这 些 对 象 的 页 面 。 像 这 样 ， 虽 然 程序 能 在 





也 就 是 说 只 
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广度 优先 搜索 的 一 开始 把 对 象 安排 在 理想 的 状态 ， 但 随 着 搜索 的 推进 ， 对 象 的 安排 就 逐渐 向 
着 不 理想 的 状态 发 展 了 。 


以 上 提 到 的 这 些 对 于 大 家 理解 近似 深度 优先 搜索 方法 的 算法 是 不 可 或 缺 的 ， 请 大 家 务必 
记 牢 。 


4.5.2 ”前提 


接 下 来 要 为 大 家 介绍 的 是 对 Cheney 的 算法 改良 后 的 近似 深度 优先 搜索 法 。 在 这 个 方法 中 ， 
我 们 要 用 到 下 面 4 个 重要 的 变量 














。 $page 
。 $local_scan 
。 $major_scan 


。 $free 
































首先 是 $page， 它 是 将 堆 分 割 成 一 个 个 页 面 的 数组 。$page[i] 指向 第 并 个 页 面 的 开头 。 

$local_scan 是 将 每 个 页 面 中 搜索 用 的 指针 作为 元 素 的 数组 。$1local_scan[i] 指向 第 
i 个 页 面 中 下 一 个 应 该 搜索 的 位 置 。 

$major_scan 是 指向 搜索 尚未 完成 的 页 面 开 头 的 指针 。 

$free 和 在 Cheney 的 算法 中 一 样 ， 都 是 指向 分 块 开 头 的 指针 。 


4.5.3 ”执行 过 程 


那么 我 们 趁 热 打 铁 ， 用 图 来 为 大 家 解说 一 下 近似 深度 优先 搜索 的 方法 吧 。 请 看 图 4.13。 
首先 复制 A 到 To 空间 ， 然 后 搜索 A， 复 制 B 和 C。 它 们 都 被 复制 到 了 第 0 页 。 到 这 里 
跟 Cheney 的 算法 完全 一 样 。 这 时 候 To 空间 的 状态 如 图 4.15 所 示 。 
































$page[0] 


四 


$local | 


$major_scan $free 








图 4.15 复制 并 搜索 A， 复 制 B 和 C 之 后 
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因为 A 已 经 搜索 完了 ， 所 以 $local_scan[0] 指向 B。 

$free 在 此 指向 第 1 页 的 开头 ， 也 就 是 说 ， 在 下 一 次 复制 中 对 象 会 被 安排 到 新 的 页 面 
在 这 种 情况 下， 程序 会 从 $major_scan 引用 的 页 面 的 $1ocal_scan 开始 搜索 。 

此 外 ， 当 对 象 被 复制 到 新 页 面 时 ， 程 序 会 根据 这 个 页 面 的 $1ocal_scan 进行 搜索 。 搜 
索 会 一 直 持续 到 新 页 面 被 对 象 全 部 占 满 为 止 。 

此 时 因为 $major_scan 还 指向 第 0 页 ， 所 以 还 跟 之 前 一 样 从 $local_scan[0] 开始 搜索 。 
也 就 是 说 ， 下 面 要 搜索 B。 














$page[0] $page[1] 
A | B C | D 
$local scan[0] $local scan[1] 
$major_ scan $free 


图 4.16 搜索 B， 复 制 D 之 后 





首先 复制 了 被 B 引用 的 D， 在 这 里 DD 被 安排 到 了 $page[1] 的 开头 。 像 这 样 对 象 被 安排 
到 页 面 开 头 时 ， 程 序 会 使 用 该 页 面 的 $local_scan 进行 搜索 。 此 时 $local_scan[0] 的 搜 
索 和 暂停 ， 程 序 根据 $local_scan[1] 开始 搜索 对 象 D。 通 过 对 D 的 搜索 ,复制 了 吾 和 TI。 




















$page[0] $page[1] 
$local | $local | 1] 
$major_scan $free 


图 4.17 搜索 D， 复制 H 和 | 之 后 


在 这 里 第 1 页 已 经 满 了 ，$free 指 着 第 2 页 的 开头 。 因 此 $1ocal_scan[1] 的 搜索 暂停 ， 
程序 开始 通过 $local_scan[0] 进行 搜索 。 也 就 是 说 ， 青 次 开始 对 B 的 搜索 。 
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$page[0] $page[]] S$page[2] 
A B | eo | D | H I E 


$local scan[0] Slocal scan[1] S$local scan[2] 


$major_scan $free 


图 4.18 搜索 B， 复 制 E 之 后 





对 B 的 搜索 结束 后 , 上 被 复制 到 了 第 2 页。 因为 程序 还 要 往 新 页 面 上 复制 对 象 ， 所 以 
$local_scan[0] 的 搜索 再 次 暂停 ， 开 始 通 过 $local_scan[2] 进行 搜索 。 
因此 ， 下 一 个 要 搜索 的 是 E。 通 过 对 开 的 搜索 复制 J] 和。 












































$page[0] $page[]] $page[2] 
S$local scan[0] S$local scan[1] $local_scan[2] 
$major_scan $free 


图 4.19 搜索 E， 复 制 J 和 K 之 后 








通过 对 J 和 的 搜索 ， 第 2 页 被 填 满 了 ，$free 指向 第 3 页 的 开头 。 因 此 我 们 回 到 $major_ 
scan， 再 次 通过 $local_scan[0] 进行 搜索 。 

接 下 来 的 操作 和 上 述 步 又 一 样 ， 这 里 就 不 再 详细 说 明了 。 搜 索 完 对 象 C， 复制 完 A 到 0 
的 所 有 对 象 之 后 的 状态 如 图 4.20 所 示 。 









































$page[0] $page[1] $page[2] $page[3] $page[4] 
人 
A B CDAH I En] K FL M GAN oO 


S$local_ scan[1] $local_scan[2] $local scan[3] S$local scan[4] 


$major_scan $free 


图 4.20 复制 完 A~O 所 有 对 象 之 后 
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这 样 终于 搜索 完 第 0 页 了 ，$major_scan 指向 $page[i]。 虽 然 还 有 没 搜 索 过 的 对 象 ， 
但 这 些 对 象 都 没有 子 对 象 ， 所 以 程序 不 对 它们 进行 复制 。 
4.5.4 ”执行 结果 


那么 ,此 GC 复制 算法 是 如 何 通 过 近似 深度 优先 搜索 来 安排 对 象 的 呢 ? 结 果 如 图 4.21 所 
示 。 请 大 家 将 图 4.21 与 图 4.14(Cheney 的 GC 复制 算法 的 执行 结果 ) 相 比较 看 看 。 














































































































图 4.21 通过 近似 深度 优先 搜索 安排 对 象 


很 明显 能 够 看 出 ， 跟 Cheney 的 使 用 广度 优先 搜索 的 GC 复制 算法 不 同 ， 在 使 用 近似 深 
度 优 先 搜索 的 情况 下 ， 不 管 在 哪 一 个 页 面 里 ,对象 间 都 存在 着 引用 关系 。 

为 什么 会 出 现 这 样 的 结果 呢 ? 这 是 因为 此 算法 采用 的 不 是 完整 的 广度 优先 搜索 ， 而 是 在 
每 个 页 面 上 分 别 进行 广度 优先 搜索 。 这 里 利用 了 我 们 在 4.5.1 节 中 提 到 的 广度 优先 搜索 的 性 质 ， 
即 在 搜索 一 开始 把 有 引用 关系 的 对 象 安排 在 同一 个 页 面 中 。 


! 掉 多 空间 复制 算法 


GC 复制 算法 最 大 的 缺点 是 只 能 利用 半 个 堆 。 这 是 因为 该 算法 将 整个 堆 分 成 了 两 半 ， 每 
次 都 要 腾 出 一 半 。 

那么 把 堆 再 作 细 分 会 如 何 呢 ? 举 个 例子 ， 我 们 不 把 堆 分 成 2 份 ， 而 是 分 成 10 份 ， 其 中 
需要 拿 出 2 块 空 间 分 别 作为 From 空间 和 To 空间 来 执行 GC 复制 算法 。 反 正 无 论 如 何 都 要 空 
出 1 块 空间 来 当 To 空间 ， 那 我 们 就 把 这 个 额外 负担 降 到 整体 的 1/10 就 行 了 。 

接 下 来 ,我 们 必须 用 别 的 方法 对 剩 下 的 8 块 空间 执行 CC。 在 这 里 GC 标记 - 清除 算法 
又 登场 了 。 

多 空间 复制 算法 说 白 了 就 是 把 堆 N 等 分 ， 对 其 中 2 块 空间 执行 CC 复制 算法 ， 对 剩 下 的 
(N-2) 块 空间 执行 GC 标记 - 清除 算法 ,也 就 是 把 这 2 种 算法 组 合 起 来 使 用 。 
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4.6.1 _ multi_space_copying() 函数 
首先 我 们 用 伪 代 码 来 看 看 多 空间 复制 算法 吧 。multi_space_copying() 因数 如 代码 清单 4.6 
所 示 。 


代码 清单 4.6: multi_space_copying() 函数 





1 | multi_space_copying()T{ 

2 $free = $heap[$to_space_index] 

3 for(r : $roots) 

4 *r = mark_or_copy(*r) 

5 

6 for(index : 0..(N-1)) 

x if(is_copying_index(index) == FALSE) 
8 sweep_block(index) 

9 

10 $to_space_index = $from space_index 

1 $from_space_index = ($from_space_index + 1) %N 
12 |} 





这 里 将 堆 N 等 分 ,开头 分 别 是 $heap[0], $heap[1],…, $heap[N-1]。 这 时 $heap[$to- 
space_index] 表示 的 是 To 空间 。 每 次 执行 GC 时 ，To 空间 都 会 像 $Sheap [0], $heap [1], …， 
$heap[N-1], $heap[0] 这 样 进行 替换 。From 空间 在 To 空间 的 右边 , 也 就 是 $heap[1]， 
$heap [2],*…, $heap [N-2], $heap [N-1]。 

在 第 3 行 和 第 4 行 给 活动 对 象 打上 标记 。 这 个 操作 一 眼看 去 很 像 GC 标记 - 清除 算法 中 
的 标记 阶段 。 

不 过 有 一 点 不 同 , 就 是 该 算法 考虑 到 了 对 象 在 from 空间 ($heap[$from_space_ 
index] ) 里 的 情况 。 当 参数 obj 在 From 空间 里 时 ，mark_or_copy() 函数 会 将 其 复制 到 To 
空间 ， 返 回 其 复制 完毕 的 对 象 。 如 果 obj 在 除 From 空间 以 外 的 其 他 地 方 ，mark_or_copy() 
函数 会 像 通常 的 标记 函数 一 样 给 对 象 打 上 标记 ,递归 标记 或 者 复制 它 的 子 对 象 。 关 于 mark_ 
or_copy() 函数 ， 我 们 将 在 下 一 节 中 进行 介绍 。 

第 6 行 到 第 8 行 是 清除 阶段 。 这 里 跟 以 往 的 GC 标记 - 清除 算法 基本 一 致 ， 位 于 From 
空间 和 To 空间 以 外 的 分 块 且 没 被 标记 的 对 象 会 被 连接 到 空闲 链表 。 

最 后 将 To 空间 和 From 空间 往 右 移动 一 个 位 置 ，GC 就 结束 了 。 
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4.6.2 mark_or_copy( 函数 


下 面 我 们 来 讲 讲 mark_or_copy() 函数 。 


代码 清单 4.7: mark_or_copy() 函数 


1 


OO OR 人 wD 


上 
© 


mark_or_copy (obj){ 
if(is_pointer_to_from_space(obj) == TRUE) 
return copy(obj) 
else 
if(obj.mark == FALSE) 
obj.mark = TRUE 
for(child : children(obj)) 
*child = mark_or_copy(*child) 


return obj 





} 




















首先 在 第 2 行 调查 参数 obj 是 否 在 From 空间 里 。 如 果 在 From 空间 里 ,那么 它 就 是 GC 








复制 算法 的 对 象 。 这 时 就 通过 copy() 函数 复制 obj， 返 回 新 空间 的 地 址 。 














如 果 obj 不 在 From 空间 里 , 它 就 是 GC 标记 - 清除 算法 的 对 象 。 这 时 要 设置 标志 位 ， 


对 其 子 对 象 递归 调用 mark_or_copy() 因数 。 最 后 不 要 忘 了 返回 obj。 


4.6.3 ”COPpYy() 浮 数 


最 后 我 们 来 看 看 copy() 荫 数 。 


代码 清单 4.8: 多 空间 复制 算法 中 的 copy() 函数 


OO oO No a 人 WW De 


上 
口 


copy (obj){ 
if (obj.tag != COPIED) 

copy_data($free, obj, obj.size) 

obj.tag = COPIED 

obj.forwarding = $free 

$free += obj.size 

for(child : children(obj.forwarding)) 
*child = mark_or_copy (*child) 


return obj.forwarding 





} 


这 里 的 copy() 函数 基本 上 和 Fenichel 等 人 提出 的 GC 复制 算法 中 的 copy() 函数 (代码 




















清单 4.2) 一 样 ， 只 有 一 点 不 同 ， 那 就 是 不 在 第 8 行 递归 调用 copy() 函数 ， 而 是 调用 mark_ 
or_copy() 函数 。 如 果 对 象 *child 是 复制 对 象 ， 则 通过 mark_or_copy() 函数 再 次 调用 这 
个 copy() 函数 。 
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4.6.4 _ 执行 过 程 


在 这 里 我 们 用 图 来 更 具体 地 看 一 下 多 空间 复制 算法 的 流程 吧 。 我 们 设 份 数 N 为 4， 请 看 
图 4.222， 


To 空间 From 空间 
$heap[0] $heap[1] $heap[2] $heap[3] 








空闲 链表 [| 分 类 
国 | 正在 使 用 的 空间 




















图 4.22 在 开始 执行 第 1 次 GC 之 前 


To 空间 $heap[0] 空 着 ， 其 他 的 3 个 空间 都 安排 有 对 象 。 在 这 个 状态 下 执行 GC 就 会 变 
成 图 4.23 这 样 。 





To 空间 From 空间 
$heap[0] $heap[1] $heap[2] $heap[3] 











空闲 链表 LL 分 块 
国 | 正在 使 用 的 空间 





图 4.23 第 1 次 GC 结束 之 后 


我 们 将 $heap [0] 作为 To 空间, 将 $heap[1] 作为 From 空间 执行 了 GC 复制 算法 。 此 
外 , 在 $heap[2] 和 $heap[3] 中 执行 了 GC 标记 -清除 算法 ,将 分 块 连接 到 了 空 闪 链表 。 
当 mutator 申请 分 块 时 ， 程 序 会 从 这 个 空闲 链表 或 $heap [0] 中 分 割 出 分 块 给 mutator。 

接 下 来 , 将 To 空间 和 From 空间 分 别 移动 一 个 位 置 , 将 $heap[1] 作为 To 空间, 将 
$heap [2] 作为 From 空间 ， 执 行 下 面 的 GC。 

mutator 基于 这 个 状态 重新 开始 执行 。 让 我 们 来 设想 一 下 再 次 没有 了 分 块 的 情况 ， 请 看 图 4.24。 





9 这 张 图 没有 考虑 到 碎片 化 。 


4.6 多 空间 复制 算法 





To 空间 From 空间 
$heap[0] $heap[1] $heap[2] $heap[3] 





空闲 链表 国 分 块 
国 | 正在 使 用 的 空间 








图 4.24 ”在 开始 执行 第 2 次 GC 之 前 




















请 大 家 注意 ,这 次 $heap[1] 是 To 空间，$heap[2] 是 From 空间 。 在 这 种 状态 下 执行 
GC， 堆 就 会 变 成 如 图 4.25 所 示 的 状态 。 





To 空间 From 空间 


$heap[0] $heap[1] $heap[2] $heap[3] 








空闲 链表 [| 分头 
国 | 正在 使 用 的 空间 








二 

















图 4.25 第 2 次 GC 结束 之 后 


$heap [2] 的 活动 对 象 都 被 复制 到 了 $heap [1] 中 ,在 $heap[0] 和 $heap[3] 中 执行 了 
GC 标记 - 清除 算法 。 
此 外 ， 为 了 准备 下 一 次 GCC， 我 们 将 $heap [2] 设 为 To 空间 ， 将 $heap [3] 设 为 From 空间 。 


4.6.5 ”优点 

多 空间 复制 算法 没有 将 堆 二 等 分 ， 而 是 分 割 成 了 更 多 块 空间 ， 从 而 更 有 效 地 利用 了 堆 
以 往 的 GC 复制 算法 只 能 使 用 半 个 堆 ， 而 多 空间 复制 算法 仅仅 需要 空 出 一 个 分 块 ， 不 能 使 用 
的 只 有 UN 个 堆 。 

4.6.6 ”缺点 


执行 G6C 复制 算法 的 只 有 NN 等 分 中 的 两 块 空间 ， 对 于 剩 下 的 (N-2) 块 空间 执行 的 是 GC 
标记 - 清除 算法 。 因 此 就 出 现 了 GC 标记 - 清除 算法 固有 的 问题 一 一 分 配 耗费 时 间 、 分 块 








O 
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碎片 化 等 。 

只 要 把 执行 GC 标记 - 清除 算法 的 空间 缩小 ， 就 可 以 缓解 这 些 问 题 。 打 个 比方 ， 如 果 让 
N 二 3， 就 能 把 发 生 碎片 化 的 空间 控制 在 整体 堆 的 3。 不 过 这 时 候 为 了 在 剩 下 的 2/3 的 空间 
里 执行 GC 复制 算法 ,我 们 就 不 能 使 用 其 中 的 一 半 ， 也 就 是 堆 空 间 的 1/3。 

综 上 ,不 管 是 GC 标记 - 清除 算法 还 是 GC 复制 算法 ， 都 各 有 各 的 缺点 。 大 家 也 都 明白 ， 
几乎 不 存在 没有 缺点 的 万 能 算法 。 
































GC 标记 一 压缩 算法 





GC 标记 - 压缩 算法 (Mark Compact GC ) 是 将 GC 标记 - 清除 算法 与 GC 复制 算 
法 相 结 合 的 产物 ， 因 此 我 们 要 以 第 2 章 和 第 4 章 的 内 容 为 前 提 来 向 大 家 说 明 。 


5e 和 ore Compact // 


4 
(vv 


Boom' 


J 
Cd 
~ 
) 


:各 放 什么 是 GC 标记 一 压缩 算法 


GC 标记 - 压缩 算法 由 标记 阶段 和 压缩 阶段 构成 。 

首先 ， 这 里 的 标记 阶段 和 我 们 在 讲解 GC 标记 - 清除 算法 时 提 到 的 标记 阶段 完全 一 样 。 

接 下 来 ， 我 们 要 搜索 数 次 堆 来 进行 压缩 。 压 缩 阶段 通过 数 次 搜索 堆 来 重新 装填 活动 对 象 。 
因 压 缩 而 产生 的 优点 我 们 已 经 在 第 4 章 中 介绍 GC 复制 算法 时 提 过 了 ， 不 过 它 跟 GC 复制 算 
法 不 同 ， 不 用 牺牲 半 个 堆 。 

本 章 中 首先 为 大 家 介绍 Donald E. Knuth B0 研究 出 来 的 Lisp2 算法 。 


5.1.1 _ Lisp2 算 法 的 对 象 
在 详细 介绍 这 个 算法 之 前 ， 需 要 大 家 先 了 解 一 下 这 个 算法 中 对 象 的 结构 。 
Lisp2 算法 在 对 象 头 里 为 forwarding 指针 留 出 了 空间 。 这 里 的 forwarding 指针 跟 GC 复 
制 算法 中 的 用 法 一 样 。 不 过 在 GC 复制 算法 中 , 我 们 将 复制 后 的 对 象 名 (如 A‘ B' 等 ) 用 
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forwarding 指针 表示 ， 在 本 章 中 则 将 对 象 的 目标 地 点 用 箭头 指出 。 这 是 因为 设 定 forwarding 
指针 时 还 不 存在 移动 完毕 的 对 象 。 
Lisp2 算法 中 的 对 象 如 图 5.1 所 示 。 





forwarding 指针 
pe 2 
头 域 


图 5.1 Lisp2 算 法 中 的 对 象 


5.1.2 ”概要 
那么 我 们 来 看 一 下 Lisp2 算法 。 举 个 例子 ， 假 设 我 们 要 在 图 5.2 这 种 情况 下 执行 CGC。 








5.2 初始 状态 





首先 是 标记 阶段 。 标 记 阶 段 结束 后 的 堆 状 态 如 图 5.3 所 示 。 这 里 的 标记 阶段 跟 我 们 在 第 
2 草 中 为 大 家 介绍 的 完全 相同 ， 这 里 就 不 再 详细 介绍 了 。 












4 玫 国 国 | 
C 





WA | 
D 已 下 


5.3 标记 阶段 结束 后 
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压缩 阶段 结束 后 的 堆 状 态 如 图 5.4 所 示 。 








Se 


图 5.4 压缩 阶段 结束 后 











通过 图 我 们 能 够 确认 , 图 5.2 中 的 活动 对 象 B、C、D 、F 分 别 对 应 图 5.4 中 的 BC 
D'、F'。 在 Lisp2 算法 中 ， 压 缩 阶 段 并 不 会 改变 对 象 的 排列 顺序 ， 只 是 缩小 了 它们 之 间 的 空隙 ， 
把 它们 聚集 到 了 堆 的 一 端 。 

这 里 压缩 阶段 的 伪 代 码 如 代码 清单 5.1 所 示 。 


代码 清单 5.1: 压缩 阶段 


1 | compaction_phase(){ 














2 set_forwarding_ptr() 
3 adjust_ptr() 

4 move_obj () 

5 | 了 


如 代码 清单 5.1 所 示 ， 压 缩 阶段 由 以 下 3 个 步骤 构成 。 


1. 设 定 forwarding 指针 
2. 更 新 指针 
3. 移动 对 象 


各 步骤 分 别 对 应 代码 清单 5.1 的 第 2 行 到 第 4 行 。 下 面 我 们 将 依次 对 每 个 步 又 进行 说 明 。 
5.1.3 _ 步骤 1 一 一 设 定 forwarding 指 针 
在 步骤 1 中 , 程序 首先 会 搜索 整个 堆 ， 给 活动 对 象 设 定 forwarding 指针 。 对 象 obj 的 


forwarding 指针 可 以 用 obj.forwarding 来 访问 。 另 外 ,我 们 设 初始 状态 下 的 forwarding 指针 
为 NULL。 负 责 执 行 这 项 操作 的 set_forwarding_ptr() 函数 如 代码 清单 5.2 所 示 。 





代码 清单 5.2: set_forwarding_ptr() 函数 
1 | set_forwarding_ptr(){ 
2 scan = new_address = $heap_start 
3 while(scan < $heap_end) 
4 if(scan.mark == TRUE) 
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scan.forwarding = new_address 
new_address += scan.size 


scan += scan.size 


0 -3 a 




















scan 是 用 来 搜索 堆 中 的 对 象 的 指针 ，new_address 是 指向 目标 地 点 的 指针 。 我 们 在 之 后 
的 说 明 中 还 会 用 到 这 两 个 指针 ， 请 大 家 牢记 。 

一 旦 scan 指针 找到 活动 对 象 ， 就 会 将 对 象 的 forwarding 指针 的 引用 目标 从 NULL 更 新 到 
new_address， 将 new_address 按 对 象 长 度 移动 。 在 第 4 行 到 第 6 行进 行 的 就 是 这 些 操作 。 
set_forwarding_ptr() 函数 执行 完毕 后 ， 扒 的 状态 如 图 5.5 所 示 。 

















ET 于 站 TT Ti 逆 硬 国 
Scan 
new_ address 











图 5.5 set_forwarding_ptr() 函数 执行 完毕 后 


请 大 家 确认 B、C、D 、F 的 各 对 象 的 forwarding 指针 分 别 引 用 了 图 5.4 中 的 B/、C'、D'、F。 

我 们 在 这 里 给 forwarding 指针 留 出 空间 是 有 原因 的 。GC 复制 算法 把 From 空间 和 To 空 
间 完 全 分 割 开 来 了 ， 因 此 将 对 象 A 作为 A’ 移动 到 To 空间 后 ， 对 象 A 的 域 就 留 在 了 From 空 
间 里 ， 这 样 一 来 就 能 把 forwarding 指针 记录 在 这 个 域 里 。 

然而 ， 因 为 在 GC 标记 - 压缩 算法 中 新 空间 和 原 空 间 是 同一 个 空间 ， 所 以 有 可 能 出 现 把 
移动 前 的 对 象 覆 盖 掉 的 情况 。 因 此 在 移动 对 象 前 ， 需 要 事先 将 各 对 象 的 指针 全 部 更 新 到 预计 
要 移动 到 的 地 址 。 这 样 一 来 ， 之 后 只 要 移动 对 象 ，GC 就 结束 了 。 

为 了 在 移动 对 象 前 更 新 指针 ， 不 能 在 域 中 设 定 forwarding 指针 。 因 为 这 样 一 来 mutator 
所 使 用 的 数据 会 消失 掉 。 因 此 这 个 算法 需要 确保 专门 的 域 。 
































5.1.4 


Sal 


步骤 2 一 一 更 新 指针 
在 步骤 2 中 要 通过 adjust_ptr() 图 数 来 更 新 各 个 对 象 的 指针 。 

















代码 清单 5.3: adjust_ptr() 函数 





1 | adjust_ptr(){ 

2 for(T : $roots) 

3 *r = (*r).forwarding 

4 

5 scan = $heap_start 

6 while(scan < $heap_end) 

7 if(scan.mark == TRUE) 

8 for(child : children(scan)) 
9 *child = (*child).forwarding 
10 scan += scan.size 

11 |} 


5.1.5 


首先 在 第 2 行 和 第 3 行 重 写 根 的 指针 。 
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然后 在 第 6 行 到 第 10 行 搜索 堆 ， 重 写 所 有 活动 对 象 的 指针 。 用 于 重 写 的 代码 和 第 2 行 、 
第 3 行 是 一 样 的 。 请 大 家 注意 ， 这 样 就 是 第 2 次 对 整个 堆 执行 搜索 了 。 


























5.6 adjust_ptr() 函数 执行 完毕 后 


步骤 3 一 一 移动 对 象 





在 步骤 3 中 搜索 整个 堆 ， 





将 活动 对 象 移动 到 forwarding 指针 的 引用 目标 处 。 请 大 家 注意 ， 











这 样 一 来 就 是 第 3 次 搜索 整个 堆 


代码 清单 5.4: move_obj() 函数 
1 | move_obj Ot{ 


scan = $free = 


Ts 





$heap_start 


2 
3 while(scan < $heap_end) 
4 if(scan.mark == TRUE) 
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5 new_address = scan.forwarding 

6 copy_data(new_address, scan, scan.size) 
7 new_address.forwarding = NULL 

8 new_address.mark = FALSE 

9 $free += new_address.size 

10 scan += scan.size 

4 | 汪 





搜索 堆 找到 活动 对 象 时 ， 在 第 5 行 到 第 8 行将 找到 的 对 象 移动 到 forwarding 指针 的 引用 
目标 处 (不 过 因为 在 这 里 要 利用 copy_data() 函数 ， 所 以 严格 意义 上 来 说 应 该 说 是 复制 而 不 
是 移动 )。 

在 这 里 大 家 可 能 会 担心 通过 copy_data() 函数 会 把 活动 对 象 覆 盖 了 呢 ， 事实 上 没有 必要 
担心 。 如 5.1.2 节 中 所 述 ， 本 算法 不 会 改变 对 象 的 排列 顺序 ， 只 是 把 对 象 按 顺 序 从 堆 各 处 向 
左 移动 到 堆 的 开头 。 因 此 ， 这 就 保证 了 目标 堆 中 已 经 没有 活动 对 象 了 。 

接 下 来 对 移动 后 的 对 象 进行 操 作 ， 将 其 forwarding 指针 设 为 NULL， 取 消 标志 位 ， 再 将 
$free 指针 移动 new_address.size 个 长 度 。 

move_obj () 函数 执行 完毕 后 ， 堆 状态 如 图 5.7 所 示 。 
























































图 5.7 move_obj() 函数 执行 完毕 后 
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可 有 效 利用 堆 

GC 标记 - 压缩 算法 和 其 他 算法 相 比 而 言 ， 堆 利用 效率 高 。 

在 GC 标记 - 压缩 算法 中 会 执行 压缩 。 执 行 压 缩 所 带 来 的 优点 我 们 已 经 在 4.2 节 中 提 过 了 。 

而 且 GC 标记 - 压缩 算法 不 会 出 现 GC 复制 算法 那样 只 能 利用 半 个 堆 的 情况 。GC 标记 - 
压缩 算法 可 以 在 整个 堆 中 安排 对 象 ， 堆 使 用 效率 几乎 是 GC 复制 算法 的 2 倍 。 用 “几乎 ” 这 个 词 ， 
是 因为 要 留 出 用 于 forwarding 指针 的 空间 ， 所 以 严格 来 说 不 到 2 倍 。 
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另 一 方面 ， 尽 管 GC 标记 - 清除 算法 也 能 利用 整个 堆 ， 但 因为 没有 压缩 的 过 程 ， 所 以 会 
产生 碎片 化 ， 不 能 充分 有 效 地 利用 堆 。 


5.3 


压缩 花费 计算 成 本 


如 上 所 述 ， 压 缩 有 着 巨大 的 好 处 。 不 过 为 了 享受 这 些 好 处 ， 我 们 也 必须 做 出 巨大 的 牺牲 。 

在 本 节 介 绍 的 Lisp2 算法 的 压缩 中 ， 必 须 对 整个 堆 进行 3 次 搜索 。 也 就 是 说 ， 执 行 该 算 
法 所 花费 的 时 间 是 和 堆 大 小 成 正比 的 。GC 标记 - 压缩 算法 的 吞吐 量 要 劣 于 其 他 算法 。 

在 GC 标记 - 清除 算法 中 ， 清 除 阶段 也 要 搜索 整个 堆 ， 不 过 搜索 1 次 就 够 了 。 但 GC 标记 - 
压缩 算法 要 搜索 3 次 ， 这样 就 要 花费 约 3 倍 的 时 间 ， 这 是 一 个 相当 巨大 的 缺陷 ， 特 别 是 堆 越 
大 ， 所 消耗 的 成 本 也 就 越 大 。 

下 面 我 们 会 为 大 家 介绍 一 种 压缩 算法 ， 采 用 这 个 算法 的 话 ， 用 较 少 的 搜索 次 数 就 能 达到 
目的 。 


:六 人 Two-Finger 算法 


下 面 我 们 将 为 大 家 介绍 Robert A. Saunders 1 人 研究 出 来 的 名 为 Two -Finger 的 压缩 算法 。 
这 是 一 种 高 效 的 算法 ， 具体 来 说 就 是 需要 搜索 2 次 堆 。 

5.4.1 ”前 提 

Two-Finger 算法 有 着 很 大 的 制约 条 件 ， 那 就 是 “必须 将 所 有 对 象 整理 成 大 小 一 致 ” 。 之 前 
介绍 的 算法 都 没有 这 种 限制 ， 而 Two-Finger 算法 就 必须 严格 遵守 这 个 制约 条 件 。 原 因 我 们 
会 在 之 后 的 内 容 中 进行 说 明 。 

另 一 方面 ，Two -Finger 算法 和 Lisp2 算法 不 同 , 没有 必要 为 forwarding 指针 准备 空间 ， 
只 需要 在 原 空间 对 象 的 域 中 设 定 forwarding 指针 即 可 。 在 这 里 我 们 将 obj.fieldl 用 作 obj 
的 forwarding 指针 ， 这 样 一 来 用 obj .forwarding 就 可 以 访问 了 。 


5.4.2 ”概要 
Two-Finger 算法 由 以 下 2 个 步骤 构成 。 



































1. 移动 对 象 
2. 更 新 指针 
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这 个 算法 的 一 大 特征 就 在 于 移动 对 象 ， 请 看 图 5.8。 




























































































































































































































































































图 5.8 Two-Finger 算 法 中 对 象 的 移动 





在 Lisp2 算法 中 ,通过 执行 压缩 操作 使 活动 对 象 往 左 边 滑动 。 而 在 Two-Finger 算法 中 ， 
则 是 通过 执行 压缩 操作 来 让 活动 对 象 填补 空闲 空间 。 此 时 为 了 让 对 象 能 恰好 填补 空闲 空间 ， 
必须 让 所 有 对 象 大 小 一 致 。 

此 外 也 请 注意 ,移动 前 的 对 象 都 会 被 保留 (图 5.8(d) 的 白色 对 象 )。 因 为 在 Two-Finger 算 
法 中 ,我 们 要 利用 放置 非 活 动 对 象 的 空间 来 作为 活动 对 象 的 目标 空间 ， 这 是 为 了 让 移动 前 的 
对 象 不 会 在 GC 过 程 中 被 覆盖 掉 。 这 样 一 来 ， 我 们 就 能 把 forwarding 指针 设 定 在 这 个 移动 前 
的 对 象 的 域 中 ,没有 必要 多 准备 出 1 个 字 了 。 

下 面 我 们 将 会 按 顺 序 为 大 家 解释 步骤 1 和 步骤 2。 

5.4.3 ”步骤 1 一 一 移动 对 象 

首先 用 $free 和 live 这 2 个 指针 ， 从 两 端 向 正中 间 搜 索 堆 。 我 们 可 以 把 这 2 个 指针 看 
作 是 手指 ， 所 以 这 个 算法 才 叫 Two-Finger 算法 。 

$free 是 用 于 寻找 非 活 动 对 象 (目标 空间 ) 的 指针 ，1live 是 用 于 寻找 活动 对 象 ( 原 空间 ) 
的 指针 。 堆 以 及 $free 和 live 指针 的 初始 状态 如 图 5.9 所 示 。 






























































5.4 Two-Finger 算 法 













































































堆 
A B CG D E F G 
[1 
4 " 4 
$free live 


5.9 ” 堆 和 两 个 指针 的 初始 状态 





2 个 指针 在 发 现 目 标 空间 和 原 空间 的 对 象 时 会 移动 对 象 。 




































































堆 
A B C D E F G 










































































F B C 以 E F G 
| | 
$free live 


图 5.10 ”移动 对 象 


在 这 里 我 们 也 用 虚线 表示 forwarding 指针 。 
move_obj 函数 用 于 执行 移动 对 象 的 操作 ， 其 伪 代 码 如 代码 清单 5.5 所 示 。 


代码 清单 5.5: move_obj 函数 


1 | move_obj OT{ 

2 $free = $heap_start 

3 live = $heap_end - 0BJ_SIZE 
4 while (TRUE) 

5 while($free.mark == TRUE) 
6 $free += 0BJ_SIZE 

7 while(live.mark == FALSE) 
8 live -= 0BJ_SIZE 

9 if($free < live) 
10 copy_data($free, live, 0BJ_SIZE) 
14 live.forwarding = $free 
12 live.mark = FALSE 
13 else 
14 break 
15 |} 
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因为 对 象 的 大 小 是 一 致 的 ， 所 以 这 里 就 将 其 设 为 0BJ_SIZE。$free 指针 从 左 端的 对 象 
($heap_start ) 开 始 癌 右 搜索 堆 ; 另 一 方面 ，live 指针 从 右 端的 对 象 ($heap_end-0BJ_SIZE) 
开始 向 左 搜索 堆 。 

在 第 5 行 和 第 6 行 ，$free 指针 跳 过 活动 对 象 进行 搜索 。 

在 第 7 行 和 第 8 行 ，live 指针 跳 过 非 活动 对 象 进行 搜索 。 

在 第 9 行 ，live 指针 指向 活动 对 象 ，$free 指针 指向 非 活动 对 象 。 此 时 2 个 指针 如 果 尚 
未 交错 ， 就 会 进行 移动 对 象 的 操作 。 此 外 ， 这 里 还 会 设 定 从 移动 前 的 对 象 指向 移动 后 的 对 象 
的 forwarding 指针 。 

在 第 9 行 ， 如 果 2 个 指针 交错 ， 则 意味 着 对 整个 堆 的 搜索 结束 ， 此 步骤 告终 。 

此 外 ， 在 代码 清单 5.5 中 ， 我 们 不 考虑 $free 指针 到 达 $heap_end 或 者 live 指针 到 达 
$heap_start 的 情况 。 因 为 这 意味 着 堆 中 的 对 象 全 是 活动 对 象 ， 或 者 全 是 非 活 动 对 象 。 这 是 
个 特例 ， 我 们 在 此 无 视 它 。 


5.4.4 步骤 2 一 一 更 新 指针 


接 下 来 寻找 指向 移动 前 的 对 象 的 指针 ， 把 它 更 新 ， 使 其 指向 移动 后 的 对 象 。 执 行 指针 更 
新 操作 的 是 adjust_ptr() 函数 。 首 先 请 看 图 5.11。 




















































































































live $free 


图 5.11 对 象 移动 结束 时 的 两 个 指针 





当 对 象 移动 结束 时 ，$free 指针 指向 分 块 的 开头 ， 这 时 位 于 $free 指针 右边 的 是 以 下 两 
者 之 一 。 

。 非 活动 对 象 

。 移 动 前 的 对 象 

















因此 ， 指 向 $free 指针 右边 地 址 的 指针 引用 的 是 移动 前 的 对 象 。 让 我 们 基于 这 点 来 看 看 
adjust_ptr() 函数 吧 。 
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代码 清单 5.6: adjust_ptr() 函数 


1 | adjust_ptr(){ 

2 for(r : $roots) 

3 if(*r >= $free) 

4 *r = (*r).forwarding 

5 

6 scan = $heap_start 

7 while(scan < $free) 

8 scan.mark = FALSE 

9 for(child : children(scan)) 
10 if(*child >= $free) 
1 *child = (*child).forwarding 
12 Scan += 0BJ_SIZE 
13 | 了 





按照 先 根 后 堆 的 顺序 来 调查 指针 。 当 指针 引用 的 对 象 在 $free 右边 时 ， 就 意味 着 这 个 对 
象 已 经 被 移动 到 了 某 处 。 大 家 也 知道 ， 在 这 种 情况 下 必须 将 指针 的 引用 目标 更 新 到 移动 后 的 
对 象 。 进 行 这 项 操作 的 就 是 第 4 行 和 第 11 行 。 

因为 活动 对 象 已 经 被 安排 在 $heap_start 和 $free 之 间 ， 所 以 搜索 完 $free 时 压缩 就 
结束 了 。 

另外 ， 因 为 此 时 $free 指针 指向 分 块 的 开头 ， 所 以 可 以 就 这 样 直接 进行 分 配 操作 。 


5.4.5 ”优点 


Lisp2 算法 要 事先 确保 每 个 对 象 都 留 有 1 个 字 用 于 forwarding 指针 ， 这 就 压迫 了 堆 。 然 而 
因为 Two-Finger 算法 能 把 forwarding 指针 设置 在 移动 前 的 对 象 的 域 里 ， 所 以 不 需要 额外 的 内 存 
空间 以 用 于 forwarding 指针 ， 因此 在 内 存 的 使 用 效率 上 ， 该 算法 要 比 Lisp2 算法 的 使 用 效率 高 。 

此 外 ， 在 Two-Finger 算法 中 ,压缩 所 带 来 的 搜索 次 数 只 有 2 次 ， 比 Lisp2 算法 少 1 次， 
在 吞吐 量 方面 占 优势 。 


5.4.6 ”缺点 


就 像 我 们 在 介绍 GC 复制 算法 时 所 说 的 那样 ， 将 具有 引用 关系 的 对 象 安排 在 堆 中 较 近 的 
位 置 ， 就 能 够 通过 缓存 来 提高 访问 速度 。 不 过 Two-Finger 算法 则 不 考虑 对 象 间 的 引用 关系 ， 
一 律 对 其 进行 压缩 ， 结 果 就 导致 对 象 的 顺序 在 压缩 前 后 产生 了 巨大 的 变化 。 因 此 ， 我 们 基本 
上 也 无 法 期 待 这 个 算法 能 沾 缓 存 的 光 。 

此 外 该 算法 还 有 一 个 限制 条 件 ， 那 就 是 所 有 对 象 的 大 小 必须 一 致 。 因 为 能 消除 这 个 限制 
的 处 理 系统 不 大 多， 所 以 这 点 制约 了 Two-Finger 算法 的 应 用 范围 。 不 过 ， 我 们 用 第 2 章 中 介 
绍 到 的 BiBOP 法 就 能 克服 这 个 问题 。 只 要 把 同一 大 小 的 对 象 安排 在 同一 个 分 块 里 ， 就 能 对 
每 个 分 块 应 用 Two-Finger 算法 了 。 
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沁 - 放 | 表格 算法 


下 面 我 们 将 为 大 家 讲解 B. K. Haddon 和 W. M. Waite (站 于 1967 年 研究 出 来 的 算法 ， 这 是 一 
个 应 用 表格 来 压缩 的 方法 。 这 个 算法 和 Two-Finger 算法 一 样 ， 都 是 执行 2 次 压缩 操作 。 


5.5.1 ”概要 
表格 算法 通过 以 下 2 个 步骤 来 执行 压缩 。 














1. 移动 对 象 ( 群 ) 以 及 构筑 间隙 表格 (break table ) 
2. 更 新 指针 





步骤 1 是 让 连续 的 活动 对 象 群 一 并 移动 。 大 家 发 现 了 吧 ， 这 和 前 面 讲解 的 压缩 算法 都 不 同 。 

当然 ,我 们 不 能 光 让 对 象 群 移动 ， 还 需要 预 留 更 新 指针 所 用 的 信息 。 其 他 的 压缩 算法 都 
用 forwarding 指针 来 作为 更 新 指针 所 用 的 信息 ， 不 过 在 表格 算法 中 则 使 用 间 际 表格 。 

所 谓 间 隙 表格 ， 大 概 意思 就 是 “按照 一 个 个 活动 对 象 群 记录 下 压缩 所 需 信息 的 表格 ”。 

在 这 个 表格 里 事先 放 人 移动 前 的 对 象 群 的 信息 (位 于 对 象 群 的 首 地 址 和 较 低 地 址 的 分 块 
的 总 大 小 )。 间 际 表格 就 是 图 5.12 这 样 的 表格 。 不 过 为 了 方便 计算 地 址 ， 我 们 将 1 个 字 的 大 
小 定 为 50。 






































入 口 








图 5.12 间隙 表格 




















各 入 口 左边 的 值 是 活动 对 象 群 的 首 地 址 ， 右 边 的 值 是 分 块 的 总 大 小 。 大 家 可 能 会 有 疑问 : 
ee dn 它 会 被 放 在 空间 空间 里 。 不 过 ,间隙 表格 的 各 入 

至 少 需要 2 个 字 。 也 就 是 说 ， 这 个 算法 有 个 制约 条 件 ， 就 是 每 个 对 象 都 必须 在 2 个 字 以 上 。 

接 下 来 是 步骤 2， 在 该 步骤 中 更 新 每 个 指针 。 这 里 间隙 表格 就 要 大 显 身 手 了 ! 它 是 怎样 
大 显 身手 的 呢 ? 我 们 会 在 5.5.4 节 中 为 各 位 揭晓 。 

下 面 就 来 详细 看 看 每 个 步 又 。 步 又 1 内 容 很 多 ， 所 以 我 们 分 成 前 半 部 分 (移动 对 象 群 ) 和 
后 半 部 分 (构筑 间隙 表格 ) 来 为 大 家 说 明 。 


5.5.2 ”步骤 1( 前 半 部 分 ) 一 一 移动 对 象 群 
活动 对 象 群 移动 前 (a) 和 移动 后 (4b) 堆 的 状态 如 图 5.13 所 示 。 
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图 5.13 活动 对 象 群 移动 前 后 的 堆 空间 





执行 这 项 操作 的 是 move_obj () 函数 。 


代码 清单 5.7: move_obj() 函数 
move_obj O){ 


上 


scan = $free = $heap_start 
size = 0 
while(scan < $heap_end) 
while(scan.mark == FALSE) 
size += scan.size 
scan += scan.size 


live = scan 


‘OO 0 和 DoD wmw 


while(scan.mark == TRUE) 


上 
口 


Scan += scan.size 


上 
上 


slide_objs_and_make_bt(scan，$free，1ive，size) 


上 
ID 


$free += (Scan - live) 





上 
Cn 


} 





在 这 里 scan 指针 用 于 寻找 活动 对 象 群 ， 从 堆 开 头 开始 搜索 。 
空间 的 指针 。size 是 保持 分 块 大 小 的 变量 ， 这 里 的 分 块 指 的 是 用 来 
在 第 5 行 到 第 7 行 ，scan 指针 负责 寻找 活动 对 象 群 的 开头 。 























$free 是 指向 对 象 群 目标 
记录 到 间 际 表格 里 的 分 块 。 
也 就 是 说 ， 直 到 它 找到 活 




















动 对 象 为 止 ， 都 会 跳 过 非 活 动 对 象 。 与 此 同时 ,使 用 size 计算 scan 指针 跳 过 的 空间 的 大 小 。 
第 6 行 和 第 7 行进 行 的 是 同一 计算 ， 不 过 请 注意 scan 是 指针 ，size 是 整数 。 
搜索 结束 时 scan 指针 指向 活动 对 象 群 的 开头 。 在 第 8 行 ， 将 这 个 位 置 记 录 在 live 指针 











里 。 这 个 指针 由 scan 指针 发 现 ， 用 于 记录 活动 对 象 群 的 开头 。 
接 下 来 ,在 第 9 行 和 第 10 行 继续 使 用 scan 指针 ， 搜 索 连 续 
11 行 之 前 ，live 和 scan 之 间 已 经 连续 存在 活动 对 象 群 了 。 这 时 夫 





的 活动 对 象 群 。 在 执行 第 
的 状态 如 图 5.14 所 示 。 
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堆 
A B C D E F G H 
EB | 
size | 
$free live scan 


图 5.14 move_obj() 函数 第 11 行 结束 时 堆 的 状态 


在 第 11 行 的 slide_objs_and_make_bt() 函数 中 执行 移动 活动 对 象 群 和 构筑 间 际 表格 
的 操作 。 对 象 群 的 原 空间 是 live， 目标 空间 是 $free， 要 移动 的 对 象 群 的 总 大 小 是 (scan- 
live)。 关 于 间 际 表格 的 构筑 ， 我 们 会 在 后 面 进行 说 明 。 

在 第 12 行 准备 下 一 次 移动 , 将 $free 移动 (scan-live) 个 大 小 ， 即 $free 的 移动 大 小 
等 于 要 移动 的 对 象 群 的 大 小 。 对 象 群 的 移动 如 图 5.15 所 示 。 




































































































































































































































































B’ C F’ GT 


图 5.15 ”对 象 群 的 移动 


日 


这 里 和 Lisp2 算法 一 样 ， 都 是 通过 把 活动 对 象 向 左 滑 动 来 执行 压缩 。 不 过 这 里 不 是 分 别 
移动 各 个 对 象 ， 而 是 移动 连续 的 活动 对 象 群 。 在 此 分 别 移动 的 是 对 象 群 BC 和 FC。 

5.5.3 ”步骤 1( 后 半 部 分 ) 一 一 构筑 间隙 表格 

虽然 在 图 5.15 中 没有 体现 出 来 ， 但 每 次 移动 对 象 群 时 ， 都 需要 把 移动 前 的 信息 注册 到 
间隙 表格 里 。 注 册 入 口 是 所 移动 的 对 象 群 的 首 地 址 (Live) 和 此 前 对 象 群 滑动 大 小 (size) 的 
组 合 。 
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图 5.16 ”间隙 表格 的 各 个 入 口 


间 际 表格 的 构筑 是 在 代码 清单 5.7 的 第 11 行 ， 即 slide_objs_and_make_bt() 函数 的 内 
部 执行 的 。 因 为 构筑 间 辽 表格 是 一 项 很 复杂 的 处 理 ， 所 以 我 们 在 这 里 就 不 采用 伪 代 码 ， 而 是 
采用 图 来 为 大 家 解说 。 

间 际 表格 的 构筑 由 以 下 两 项 操作 构成 。 











。 移 动 对 象 群 
。 移 动 间隙 表格 


关于 如 何 移动 对 象 群 ， 我 们 已 经 在 前 面 跟 大 家 解释 过 了 。 构 筑 间 际 表格 的 情况 如 图 5.17 
所 示 。() 内 的 数字 表示 的 是 各 个 对 象 的 首 地 址 ( 设 1 个 字 的 大 小 为 50)。 













































































































































































堆 
(a) 
A(0)  B(100)  C(250) DG50) E(450) F(550)  G(700) H(800) 
外 一 一 一 A 
size | 
$free live scan UL 
间 际 表格 
(b) 100|100 
B'(0) C150) DG350) EC450) F(550) G(700) HC800) 








让 
| size | 
$free ny live scan 


间 耻 表格 
(0) 550300 100100 
B’(0) C150) F250)  G(400) 






















































































图 5.17 构筑 间隙 表格 


如 图 5.17(a)， 在 移动 对 象 群 BC 的 同时 构筑 间 际 表格 。 将 BC 的 首 地 址 (100) 以 及 BC 左边 
分 块 的 总 大 小 (100) 组 合成 一 对 ， 通 过 scan 指针 写 人 已 知 为 分 块 的 350 号 地 址 。 
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接 下 来 请 看 图 5.17(b)， 这 里 进行 的 是 移动 对 象 群 FG 的 操作 。 这 时 要 注册 到 间 院 表格 的 
信息 是 (550，300),， 不 过 不 能 直接 将 该 信息 写 入 (100，100) 之 后 ( 即 450 号 地 址 )。 因 为 对 
象 群 FG 要 移 到 这 里 。 

这 时 我 们 要 让 所 有 已 有 的 间 际 表格 “先行 回避 ”， 也 就 是 把 (100，100) 移 动 到 FG 右边 
的 分 块 (800 号 地 址 )。 这 样 一 来 FG 就 能 移动 了 ， 我 们 将 其 移动 。 

最 后 ,将 这 次 要 注册 的 信息 (550，300) 设 置 在 移动 FG 后 空 出 来 的 空间 ， 也 就 是 800 号 
地 址 左边 的 700 号 地 址 里 。 

这 确实 是 很 复杂 的 操作 ， 完 成 后 的 状态 如 图 5.17(e) 所 示 。 在 这 里 请 注意 间 际 表格 的 入 
口 顺序 。 各 个 入 口 不 是 按 入 口 里 的 第 一 元 素 排列 的 ， 也 就 是 说 ,不 是 按 活动 对 象 群 的 首 地 址 
(Live) 的 顺序 排列 的 。 这 是 为 什么 呢 ? 

在 图 5.17(b) 中 ， 因 为 间 际 表格 妨碍 到 对 象 群 FG 的 移动 ， 所 以 我 们 让 它 先 回避 到 800 号 
地 址 ， 这 之 后 再 移动 FG， 将 (5$0，300 ) 新 注册 到 已 成 为 分 块 的 700 号 地 址 。 

像 这 样 往 已 有 的 间隙 表格 里 新 追加 入 口 时 ， 有 时 会 出 现 只 在 表格 左 侧 有 空 闪 空间 的 情况 。 
在 这 种 情况 下 ， 表 格 的 入 口 顺 序 就 乱 了 。 

当然 ， 注 册 入 口 时 也 可 以 每 次 都 按 live 的 顺序 排列 ， 不 过 这 样 就 产生 了 额外 的 消耗 。 

然而 ， 因 为 各 入 口 没 有 按 第 一 元 素 1ive 的 顺序 排列 ， 所 以 增 大 了 下 一 个 步骤 “更 新 指针 ” 
的 计算 量 。 

如 上 ， 我 们 终于 解说 完了 第 一 个 步 又 。 


5.5.4 ”步骤 2 一 一 更 新 指针 
在 adjust_ptr() 因数 中 ， 将 引用 移动 前 的 对 象 的 指针 全 部 换 成 引用 移动 后 的 对 象 的 指针 。 
这 项 操作 本 身 和 前 面 所 讲 的 两 个 算法 中 的 操作 是 相同 的 。 
代码 清单 5.8: adjust_ptr() 函数 


adjust_ptr()T{ 





















































for(r 3 $roots) 


*r = new_address (*r) 


scan = $heap_start 
while(scan < $free) 
scan.mark = FALSE 
for(child : children(scan)) 
*child = new_address(*child) 


scan += scan.size 





[ee 
”OW oO 人 wr- 


} 

















与 之 前 所 讲 的 内 容 有 所 不 同 的 是 在 第 3 行 和 第 9 行 登场 的 new_address() 函数 。 
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代码 清单 5.9: new_address() 函数 
1 | new_address (obj){ 
best_entry = new_bt_entry(0, 0) 
for(entry : break_table) 
if(entry.address <= obj && $best_entry.address < entry.address) 
best_entry = entry 
return obj - best_entry.size 


} 





A ow Dh 


这 个 函数 会 返回 参数 obj 移动 后 的 地 址 ， 在 第 2 行 的 new_bt_entry() 函数 中 生成 虚拟 
间 院 表格 人口 。 

第 3 行 到 第 5 行 负责 调查 间 院 表格 ， 在 持 有 obj 及 其 以 下 的 地 址 (address) 的 入 口中 ， 
寻找 地 址 最 大 的 人口。 这 样 一 来 就 得 到 了 持 有 obj 所 属 对 象 群 信息 的 入 口 。 这 个 入 口 就 是 
best_entryo 

如 果 间 院 表 格 里 的 入 口 是 按 地 址 顺序 整齐 排列 的 ， 我 们 就 有 可 能 用 二 分 查找 来 有 效 地 查 
找 best_entry。 不 过 就 像 前 面 所 谨 的 那样 ， 间隙 表格 的 入 口 并 不 是 整齐 排列 的 ， 因 此 就 需 
要 像 这 样 调查 所 有 的 入 口 。 

那么 best_entry 又 意味 着 什么 呢 ? 它 是 一 个 人口 ， 这 个 人 口 持 有 obj 所 属 对 象 群 移动 
前 的 信息 。 属 于 这 个 对 象 群 的 所 有 对 象 都 会 被 向 左 移动 best_entry.size 个 大 小 。 因 此 ， 
obj 移动 后 的 地 址 就 变 成 了 obj 一 best_entry .size。 

我 们 来 更 具体 地 看 一 下 。 























































































































































































































堆 
(a) 
A(0) B(100) C(250) D(350) E(450) F(550) G(700) H(800) 
(b) 550|300||100|100 
B‘(0) C150) F(250) G400) 


图 5.18 对象 移动 前 后 的 地 址 对 比 


打 个 比方 ， 在 图 5.18 中 ， 如 果 我 们 想 知道 B 移动 到 了 B'， 首 先 就 要 以 B 的 地 址 100 为 
线索 调查 间隙 表格 ， 然 后 就 会 发 现 人 口 (100，100) 是 best_entry， 接 下 来 可 由 了 的 地 址 
100 求 得 best_entry.size， 即 将 B 的 地 址 减 去 100 得 到 B' 的 地 址 0。 

同 理 ， 我 们 可 以 从 下 的 地 址 550 减 去 入 口 (550，300) 中 的 300, 得 到 FF' 的 地 址 250。 
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5.5.5 ”优点 


在 表格 算法 中 ,没有 必要 为 压缩 准备 出 多 余 的 空间 ， 这 是 因为 该 算法 很 好 地 利用 了 分 块 ， 
保留 了 更 换 指 针 所 必需 的 信息 。 

虽然 在 不 需要 多 余 空间 这 一 点 上 表格 算法 跟 Two- Finger 一 样 ， 不 过 在 压缩 前 后 保留 对 象 
顺序 这 一 点 上 ， 表 格 算法 可 以 说 比 Two-Finger 要 优秀 得 多 。 这 是 因为 在 表格 算法 中 ， 可 以 通 
过 缓存 来 提高 对 象 的 访问 速度 。 


5.5.6 ”缺点 


要 维持 间 际 表格 需要 付出 很 高 的 代价 。 考 虑 到 每 次 移动 活动 对 象 群 都 要 进行 表格 的 移动 
和 更 新 ， 代 价 高 也 是 理所当然 的 。 

此 外 ， 在 更 新 指针 时 也 不 能 忽略 搜索 表格 所 带 来 的 消耗 。 在 更 新 指针 前 ， 如 果 先 将 表格 
排序 ， 则 表格 的 搜索 就 能 高 速 化 。 不 过 排序 表格 也 需要 相应 的 消耗 ， 所 以 并 不 能 从 根本 上 解 
决 问题 。 


:下 和 ImmixGC 算法 


接 下 来 我 们 将 会 为 大 家 介绍 Stephen M. Blackburn 和 Kathryn S. McKinley 中 于 2008 年 研 
究 出 来 的 ImmixGC 算法 。 比 起 之 前 介绍 的 算法 ， 这 个 算法 较为 高 深 ,有 一 些 较 难 理解 的 内 容 。 
不 过 不 理解 这 个 算法 也 没有 关系 ， 对 大 家 理解 之 后 的 算法 并 没有 影响 ， 所 以 不 必 勉强 自己 去 
理解 ， 跳 过 不 看 也 是 可 以 的 。 

Immix 这 个 词 有 “混合 ”的 意思 。 这 个 算法 虽然 以 GC 标记 - 清除 算法 为 基础 ， 不 过 根据 
情况 也 会 执行 压缩 。 也 就 是 说 ， 它 将 GC 标记 - 清除 算法 和 压缩 组 合 在 了 一 起 。 

据说 论文 的 作者 把 这 个 算法 实现 到 了 JikesRVM (Research Virtual Machine ) 中 的 内 存 管 理 
软件 包 MMTk (Memory Management Toolkit ) 中 。 


5.6.1 “概要 


ImmixGC 把 堆 分 为 一 定 大 小 的 “ 块 ” (block )， 再 把 每 个 块 分 成 一 定 大 小 的 “ 线 ”(line)。 
这 个 算法 不 是 以 对 象 为 单位 ， 而 是 以 线 为 单位 回收 垃圾 的 。 

分 配 时 程序 首先 寻找 空 的 线 ， 然 后 安排 对 象 。 没 找到 空 的 线 时 就 执行 CC。 

GC 分 为 以 下 3 个 步 又 执行 。 

































































Q@ JikesRVM: 目前 正在 用 开放 源码 开发 的 用 于 研究 的 虚拟 机 器 ( http://jikesrvm.org/ )。 
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1. 选 定 备用 的 From 块 
2. 搜索 阶段 


3. 清除 阶段 








不 过 该 算法 不 是 每 次 都 执行 步骤 1 的。 在 ImmixGC 中 ,只 有 在 堆 消 耗 严重 的 情况 下 ， 
为 了 分 配 足够 大 小 的 分 块 时 才 会 执行 压缩 。 此 时 会 通过 步骤 1 来 选择 作为 压缩 对 象 的 备用 块 
(备用 的 From 块 )。 

接 下 来 ， 在 步骤 2 中 从 根 搜索 对 象 ， 根 据 对 象 存在 于 何 种 块 里 来 分 别 进 行 标记 操作 或 复 
制 操作 。 具 体 来 说 ， 就 是 对 存在 于 步骤 1 中 选择 的 备用 From 块 里 的 对 象 执 行 复制 操作 ， 对 
除 此 之 外 的 对 象 进行 标记 操作 。 

步骤 3 则 是 寻找 没有 被 标记 的 线 ， 按 线 回 收 非 活动 对 象 。 

以 上 就 是 ImmixGC 的 概要 。 


5.6.2 _ 堆 的 构成 


ImmixGC 中 把 堆 分 成 块 ， 把 每 个 块 又 分 成 了 更 小 的 线 。 
据 论文 中 记载 ， 块 最 合适 的 大 小 是 32K 字 节 ， 线 最 合适 的 大 小 是 128 字 节 。 我 们 在 此 就 
直接 引用 论文 中 的 数值 。 这 样 一 来 ， 每 个 块 就 有 32 x 1024 +: 128 二 256 个 线 。 
各 个 块 由 以 下 4 个 域 构成 。 





















































。 line 
。 mark_table 
。 status 


。 hole_cnt 


打 个 比方 ,用 $block[i] .status 就 可 以 访问 位 于 第 i 号 块 的 status 域 。 关 于 这 些 域 ， 
我 们 将 会 按 顺 序 进行 说 明 。 

首先 line 就 跟 它 的 名 字 一 样 ， 是 每 个 块 的 线 ， 线 里 会 被 安排 对 象 。$block[i] .line[j] 表 
示 的 就 是 第 i 号 块 的 第 j 号 线 。 

接 下 来 的 mark_table 则 是 与 每 个 线 相对 应 的 用 于 标记 的 位 串 。 打 个 比方 , 与 第 i 号 
块 的 第 j 号 线 相 对 应 的 用 于 标记 的 位 串 就 是 $block[i] .mark_table[j]。 我 们 分 给 mark_ 
table [j] 一 个 字 节 ， 在 标记 或 分 配 下 面 的 某 个 常量 时 ， 将 其 记录 在 mark_table[j] 中 。 

















。FREE( 没 有 对 象 ) 
。MARKED (标记 完成 ) 
。ALLOCATED( 有 对 象 ) 
。CONSERVATIVE (保守 标记 ) 
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status 是 用 于 表示 每 个 块 中 的 使 用 情况 的 域 。 我 们 也 分 给 status 一 个 字 节 ， 在 执行 
GC 或 分 配 时 ， 记 录 下 面 的 某 个 常量 。 


。FREE( 所 有 线 为 空 ) 
。RECYCLABLE (一 部 分 线 为 空 ) 
。UNAVAILABLE (没有 空 的 线 ) 





当然 ， 初 始 状态 下 所 有 块 都 是 FREE。 

最 后 一 项 hole_cnt 负责 记录 各 个 块 的 “ 孔 ”(hole) 数 。 这 里 所 说 的 孔 拥 有 连续 的 大 于 等 
于 1 个 的 空 的 线 。 我 们 用 这 个 hole_cnt 的 值 作为 表示 碎片 化 严重 程度 的 指标 。 如 果 某 个 块 
hole_cnt 的 值 很 大 ,那么 它 里 面 的 对 象 就 不 是 标记 对 象 ， 而 是 复制 对 象 。 详 细 情 况 我 们 会 
在 5.6.7 节 中 进行 说 明 。 

综 上 所 述 ， 在 ImmixGC 中 ， 堆 如 图 5.19 所 示 。 

















line 






































mark_table 




















status | |RECYCLABLE RECYCLABLE 



































hole_cnt 10 4 

















$block[0] $block[1] 


图 5.19 ImmixGC 中 的 堆 


@@ 


为 什么 需要 1 个 字 节 来 用 作 标 记 ? 


mark_table[i] 只 能 容纳 4 种 常量 ， 这 么 说 来 有 2 位 就 够 了 ， 为 什么 还 要 准备 出 1 个 字 节 (8 
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位 ) 呢 ? 

事实 上 这 跟 并 行 性 有 关系 。 最 近 的 很 多 GC 都 是 通过 在 多 线程 环境 下 运行 来 并 行进 行 处 理 的 。 
ImmixGC 也 不 例外 。 

虽然 本 书 中 并 没有 详细 说 明 ， 但 是 为 了 在 多 线程 环境 下 多 个 线程 访问 同一 个 内 存 空间 ， 就 需 
要 同步 处 理 。 


为 了 实现 同步 处 理 ，CAS (Compare-And-Swap ) 命 令 是 不 可 或 缺 的 。CAS 命令 指 的 是 将 
以 下 3 项 处 理 一 并 进行 ， 即 不 被 其 他 线程 插队 的 命令 。 
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1. 读 出 某 个 内 存 空间 里 的 值 


2 以 六 出 的 人 

















直 为 基准 进行 计算 




















3. 以 计算 结果 为 基准 ， 对 步骤 1 所 在 的 内 存 空间 进行 写 入 操作 





根据 这 个 CAS 命令 ， 即 使 2 个 及 2 个 以 上 的 GC 线程 同时 访问 同一 个 内 存 空间 ， 也 不 会 出 
现 数据 不 一 致 的 问题 ， 能 得 到 正确 的 计算 结果 。 


然而 在 很 多 架 








R 构 中 ， 这 个 CAS 命令 不 是 以 1 位 为 单位 ， 而 是 以 1 个 字 节 为 单位 访问 内 存 空 


间 的 。 所 以 尽管 见长 ， 也 必须 确保 mark_table[i] 和 status 域 里 各 有 1 个 字 节 的 空间 。 


5.6.3 ”对 象 的 分 类 


在 Immix GC 


中 ， 对 象 根据 大 小 被 分 成 以 下 3 类 。 





。 小 型 对 象 : 线 以 下 大 小 

。 中 型 对 象 : 比 线 大 ， 不 到 8 区 字 节 

。 大 型 对 象 : 大 于 等 于 8K 字 节 (Immix GC 不 予 管 理 ) 

因为 大 型 对 象 由 Jikes 的 MMTk 处 理 ， 所 以 不 在 ImmixGC 中 管理 。 后 面 我 们 只 介绍 小 型 
对 象 和 中 型 对 象 。 

5.6.4 “分配 


我 们 来 看 看 ImmixGC 中 的 分 配方 法 吧 。ImmixGC 虽然 以 GC 标记 - 清除 算法 为 基础 ， 
过 却 不 在 分 配 中 使 用 空闲 链表 ， 而 是 使 用 $cursor 和 $1imit 这 两 个 指针 。 它 们 各 自 指向 
te ee ee et en a 











如 果 通 过 分 丁 


























消耗 了 一 个 孔 ， 那 么 为 了 找到 同一 个 块 中 的 其 他 孔 ， 程 序 就 会 让 $cursor 


和 $1limit 向 右 滑 动 。 如 果 这 个 块 中 所 有 的 孔 都 耗 尽 了 , 那么 程序 就 会 将 status 域 从 
RECYCLABLE 变更 到 UNAVAILABLE， 从 别 的 RECYCLABLE 块 里 找 孔 。 
如 果 调 查 完 所 有 的 RECYCLABLE 块 都 没 找到 合适 大 小 的 孔 ， 程 序 就 会 从 FREE 块 分 出 一 块 


空 的 线 。 如 果 已 


么 没有 FREE 块 了 ， 程 序 就 会 启动 CC， 确保 有 RECYCLABLE 块 或 者 FREE 块 。 

















当然 ， 初 始 状态 下 没有 RECYCLABLE 块 ， 只 有 FREE 块 ， 所 以 这 时 用 的 是 FREE 块 。 
ImmixGC 中 分 配 的 情况 如 图 5.20 所 示 。 
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$cursor e 一 
9$limit 。 一 | 


(a) 
mark_table | TE Ti 
$block[0] status:RECYCLABLE $block[1l] status:UNAVAILABLE $block[2] status:RECYCLABLE 
$eursor 。 一 一 | 分 配 100 字 节 的 对 象 
$limit 。 一 一 字 节 
status:RECYCLABLE status:UNAVAILABLE status:RECYCLABLE 
$eursor © 


i 分 配 50 字 节 的 对 象 | 
$limit 。 
ED NE LI IILIL 























































































































(b) 































































































status:UNAVAILABLE status:UNAVAILABLE status:RECYCLABLE 
MARKED 
国 ALLOCATED 
DOO FREE 
国 CONSERVATIVE | mark_table 的 值 











图 5.20 ”ImmixGC 中 的 分 配 


初始 状态 下 $cursor 和 $1limit 分 别 指向 $block[0] 最 初 的 孔 ($block[0] .line[2] ) 的 开 
涉 和 末尾 。 请 参考 图 5.20(a)。 

假设 在 此 要 分 配 100 字 节 的 对 象 。$cursor 和 $1limit 负责 寻找 和 孔 ， 搜索 RECYCLABLE 块 
的 mark_table。 

因为 $block[0] .line[2] 这 个 孔 里 能 分 配 100 字 节 的 对 象 ， 所 以 就 往 这 里 面 分 配对 象 。 
当 分 配 结束 时 ，$cursor 引用 的 是 从 $block[0] .line[2] 的 开头 往 右 滑动 100 字 节 的 位 置 ， 
$limit 引用 的 是 $block[0] .line[2] 的 末尾 。 此 外 ， 因 为 已 经 往 $block[0] .line[2] 里 安 
排 了 对 象 ， 所 以 要 事先 把 $block[0] .mark_table[2] 从 FREE 改写 为 ALLOCATED。 请 参考 图 
5.20(b), 

下 面 再 来 分 配 50 字 节 的 对 象 。 因 为 这 个 对 象 不 能 放 在 $cursor 和 $1limit 之 间 ， 所 以 
$cursor 和 $1limit 要 按照 先 搜索 $block[0] .mark_table 的 剩余 空间 ， 再 搜索 $block[2] . 
mark_table 的 顺序 来 查找 下 一 个 孔 ( 因 为 $block[1] .status 为 UNAVAILABLE， 所 以 不 查找 
block[1] .mark_table)。 最 后 我 们 可 以 得 出 ，$block[2] 的 1ine[0] 到 line[2] 都 是 孔 。 我 
们 能 往 这 个 孔 里 分 配 50 字 节 的 对 象 。 分 配 后 $cursor 从 $block[2] .line [0] 开头 癌 右 滑动 
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了 50 个 字 节 ，$block[2] .mark_table[0] 被 改写 成 了 ALLOCATED。 请 参考 图 5.20(c)。 

那么 问题 来 了 ， 因 为 中 型 对 象 比 小 型 对 象 大 ， 所 以 有 时 会 出 现 这 种 情况 : 直到 找到 合适 
大 小 的 孔 之 前 ， 小 型 对 象 都 会 被 跳 过 。 这 样 一 来 ， 小 孔 中 就 没 被 分 配 到 对 象 ， 被 直接 跳 过 了 。 
为 了 防止 出 现 这 种 情况 ， 当 不 能 在 $cursor 和 $limit 之 间 分 配 中 型 对 象 时 ， 就 不 采用 滑动 
$cursor 和 $limit 的 方法 ， 而 是 特意 从 FREE 块 里 分 配 线 。 


5.6.5 ”分配 时 的 标记 操作 


在 ImmixGC 中 ,不 仅 在 GC 时 ， 在 分 配 时 也 会 进行 标记 操作 。 在 某 个 线 line [i] 中 分 配 
对 象 时 会 在 与 这 个 线 对 应 的 mark_table[i] 中 设置 ALLOCATED。 这 是 为 了 避免 line[i] 里 的 
对 象 之 后 被 别 的 对 象 覆 盖 掉 。 

考虑 到 小 型 对 象 可 能 会 占据 line[i+l] 的 情况 , 保守 起 见 ， 当 mark_table[i+1] 是 
FREE 时 ,把 它 定 为 CONSERVATIVE。 这 里 的 CONSERVATIVE 的 意思 是 “如 果 小 型 对 象 占据 
了 line[i+1] ， 则 mark_table[i+1] 可 能 会 包含 所 分 配对 象 的 后 半 部 分 "(例如 图 5.20(a) 的 
$block[0] .line [4] 这 样 的 情况 )。 不 过 之 后 在 line [i+1] 进行 分 配 的 时 候 ， 要 事先 将 mark_ 
table[i+1] 的 值 从 CONSERVATIVE 改写 成 ALLOCATED。 

这 样 保守 的 标记 在 标记 阶段 是 很 有 用 的 。 在 标记 阶段 中 ， 每 次 搜索 对 象 都 必须 检查 这 个 
对 象 是 否 占据 了 其 他 的 线 ， 为 此 程序 每 次 都 要 调查 对 象 的 大 小 ， 因 为 要 调查 所 有 活动 对 象 ， 
所 以 这 项 处 理 就 带 来 了 额外 的 负担 。 

为 了 省 去 这 项 处 理 ， 我 们 才 采 取 了 较为 保守 的 做 法 ， 即 事先 对 小 型 对 象 打 上 CONSERVATIVE 
这 个 标记 。 因 为 程序 中 要 频繁 用 到 小 型 对 象 ， 所 以 这 个 办 法 是 非常 有 效 的 。 

另 一 方面 ， 中 型 对 象 没 有 小 型 对 象 那 么 多 ， 所 以 要 正确 地 进行 标记 。 也 就 是 说 ， 确 切 地 
调查 对 象 所 属 的 线 ， 对 所 有 对 应 的 mark_table 设 定 ALLOCATED。 

像 这 样 ， 为 了 根据 对 象 的 大 小 分 别 进行 标记 处 理 ， 在 每 次 寻找 对 象 时 都 必须 调查 对 象 的 
大 小 。ImmixGC 中 为 了 缩短 因此 所 花费 的 时 间 ， 在 头 里 准备 了 用 于 判断 小 型 / 中 型 对 象 的 位 ， 
当 要 分 配 中 型 对 象 时 就 会 事先 设置 这 个 位 。 


5.6.6 ”步骤 1 一 一 选 定 备用 From 块 


那么 我 们 接 下 来 就 要 一 步 步 逼 近 ImmixGC 的 实体 了 。 在 GC 开始 的 时 候 ，ImmixGC 会 检 
查 是 否 满足 以 下 任 一 条 件 。 

























































































。 存 在 1 个 或 1 个 以 上 没有 进行 分 配 的 RECYCLABLE 块 

。 在 上 次 GC 时 能 回收 的 线 ， 其 总 大 小 减少 了 一 定 的 量 

当 满 足以 上 任 一 条 件 的 时 候 ， 压 缩 就 会 开始 执行 。 无 法 执行 压缩 的 时 候 步骤 1 也 不 会 被 
执行 ， 直 接 进 入 下 一 个 步 又 2。 
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当 确 定 执 行 压缩 时 ， 就 要 为 压缩 选择 一 个 备用 的 From 块 。From 块 指 的 是 在 压缩 过 程 中 
作为 对 象 原 空间 的 块 。 它 跟 我 们 在 第 4 章 中 介绍 的 部 分 空间 复制 算法 中 的 From 空间 非常 像 。 

不 过 在 ImmixGC 中 ， 程 序 会 选择 碎片 化 严重 的 块 来 当 From 块 ， 以 此 来 让 压缩 取得 最 大 
效果 。 

我 们 用 块 里 的 孔 数 作为 测量 碎片 化 大 小 的 指标 。 孔 数 越 多 的 块 碎片 化 越 严重 。 

下 面 就 来 看 看 如 何 利 用 孔 数 。 首 先 来 制作 两 张 频数 分 布 直方 图 。 


。 中 请 的 直方 图 
。 可 分 配 的 直方 图 


这 两 张 图 都 以 各 个 块 中 的 孔 数 (hole_cnt ) 作为 索引 。 下 面 按 顺 序 为 大 家 解说 。 

申请 的 直方 图 表示 的 是 堆 的 所 有 线 中 那些 非 FREE 线 的 分 布 情况 。 不 过 因为 这 时 候 不 存 
在 MARKED 线 ， 所 以 表示 的 只 是 ALLOCATED 和 CONSERVATIVE 线 这 两 者 的 分 布 情况 。 

请 看 图 5.21。 该 图 表示 的 是 “在 有 2 个 孔 的 1 个 块 (也 可 能 存在 多 个 这 样 的 块 ) 中 ， 
ALLOCATED 和 CONSERVATIVE 线 的 总 数 是 277” 的 情况 。 也 就 是 说 ， 申 请 直方 图 表示 的 是 移动 
每 个 块 里 的 所 有 对 象 所 需要 的 FREE 线 总 数 的 上 限 。 
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502 
400 
227 207 215 220 216 
- on a 
0 
1 2 3 4 5 6 


孔 数 (hole_cnt) 








非 FREE 线 的 总 数 








图 5.21 申请 的 直方 图 








另 一 方面 ， 可 分 配 直方 图 表示 的 是 堆 中 FREE 线 的 分 布 情况 。 

请 看 图 5.22。 从 这 个 直方 图 中 可 以 看 出 ， 如 果 存 在 有 5 个 孔 的 一 个 块 ( 也 可 能 存在 多 个 
这 样 的 块 )， 则 这 个 块 里 的 FREE 线 总 数 为 36。 

那么 既然 已 经 有 2 张 直方 图 了 ， 我 们 就 用 它们 来 找 备 用 From 块 吧 。 为 此 我 们 需要 准备 
2 个 变量 ， 分 别 叫 作 require 和 available。 regquire 是 备用 From 块 里 非 FREE 线 的 总 数 ， 
available 是 除了 备用 From 块 以 外 的 块 所 持 有 的 FREE 线 的 总 数 。 








GD 频数 分 布 直方 图 : 纵 轴 为 频数 ， 横 轴 为 组 数 的 柱状 图 。 
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5.22 可 分 配 直方 图 








要 找 备用 From 块 ， 首 先 要 从 碎片 化 最 严重 的 块 开始 找 ， 也 就 是 从 直方 图 中 hole_cnt 最 

大 的 地 方 开 始 往 小 的 地 方 搜索 ， 这 个 过 程 是 在 require 上 加 上 申请 直方 图 的 纵 轴 ( 非 FREE 线 
的 总 数 ) 的 值 ， 从 available 里 减 去 可 分 配 直方 图 的 纵 轴 (FREE 线 的 总 数 ) 的 值 。 设 require 

的 初始 值 为 0，available 的 初始 值 是 堆 中 FREE 线 的 总 数 。 此 时 ， require < available。 

当 require > available 时 ， 对 直方 图 的 搜索 就 结束 了 。 最 后 ， 哪 些 块 的 孔 数 比 搜索 
到 的 数量 大 ， 哪 些 块 就 是 备用 From 块 。 

我 们 在 这 里 做 的 就 是 选 出 满足 "From 块 中 ALLOCATED 线 和 CONSERVATIVE 线 的 总 数 ”<“ 除 
From 以 外 的 块 中 FREE 线 的 总 数 ” 这 样 的 From 块 。 

下 面 结合 具体 的 例子 来 看 一 下 ， 依 然 使 用 图 5.21 和 图 5.22 的 直方 图 。 不 过 因为 在 实现 
上 是 用 数组 表示 直方 图 的 ， 所 以 这 里 也 用 数组 来 进行 说 明 。 

require、available 的 值 分 别 如 图 5.23 所 示 。 











孔 数 ( hole_cnt ) | 司 | 本 2: 司 | 攻 司 医 :< 司 民 = 司 | 区 a 








非 ERHEE 线 的 总 数 |502|227|207|215 |220|216| equire: 0 
FREE 线 的 总 数 | 10 | 29 | 49 | 41 | 36 | 40 | available: 717 


5.23 选 定 备 用 From 块 (初始 状态 ) 





此 外 ， 我 们 设 堆 中 存在 2 个 FREE 块 。 这 样 一 来 ， 就 不 是 从 available 减 去 可 分 配 直方 
图 中 FREE 线 的 总 数 了 ， 而 是 加 上 了 2 个 FREE 块 ， 也 就 是 加 了 512。 
首先 从 hole_cnt = 6 开始 搜索 这 个 数组 。 请 看 图 5.24。 
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require: 216 
available: 677 








5.24 选 定 备 用 From 块 (搜索 完 hole_cnt=6 时 ) 


又 因为 require < _ available， 所 以 我 们 继续 搜索 。 
图 5.25 所 示 为 搜索 完 hole_cnt = 5 时 的 情况 。 因 为 此 时 require 还 是 小 于 available， 所 
以 继续 搜索 。 





require: 436 
available: 641 








5.25” 选 定 备 用 From 块 (搜索 完 hole_cnt 二 5 时 ) 


接 下 来 就 搜索 到 了 hole_cnt = 4， 此 时 的 状态 如 图 5.26 所 示 。 这 时 因为 require > available， 
所 以 搜索 结束 。 也 就 是 说 ， 在 所 有 的 块 里 ,满足 hole_cnt 大 于 等 于 5 的 块 会 被 用 来 当 作 备用 From 块 。 

















require: 651 
available: 600 








5.26” 选 定 备 用 From 块 (搜索 完 hole_cnt 二 4 时 ) 





当 决 定 哪 些 块 是 备用 From 块 后 ，ImmixGC 会 进入 搜索 阶段 。 如 果 在 搜索 阶段 发 现 了 某 
些 对 象 ， 它 们 所 在 块 的 hole_cnt 大 于 等 于 5， 那 么 程序 就 会 试 着 通过 分 配 把 这 些 对 象 移动 
到 别 的 RECYCLABLE 或 者 是 FREE 块 里 。 

不 过 请 大 家 注意 ,我 们 在 这 里 决定 的 毕竟 是 “备用 ”From 块 ， 没 法 保证 能 把 所 有 From 
块 里 的 对 象 都 移动 到 其 他 块 里 。 

把 所 有 对 象 都 移动 到 其 他 块 里 这 种 情况 很 少 发 生 ， 论 文中 称 之 为 “投机 主义 实 的 玻 散 ” 









































中 投机 主义 : 采取 对 自己 有 利 的 做 法 和 态度 ， 也 称 为 机 会 主义 。 








5.6 ImmixGC 算 法 115 

















(opportunistic evacuation )， 就 是 “能 压缩 了 再 说 ”这 种 想法 吧 。 


5.6.7 ”步骤 2 一 一 搜索 阶段 


搜索 阶段 要 从 根 开 始 搜 索 对 象 ， 根 据 对 象 分 别 进行 标记 处 理 或 复制 处 理 。 这 里 的 复制 处 
理 指 的 是 将 备用 From 块 里 的 对 象 复制 到 别 的 块 (To 块 )， 并 进行 压缩 。 

在 搜索 阶段 中 ， 如 果 搜 索 到 的 对 象 在 备用 From 块 里 ， 那 么 就 会 进行 复制 操作 ， 如 果 在 
别 的 块 里 ， 就 会 执行 标记 操作 。 

在 执行 标记 操作 时 ， 先 设置 对 象 的 标志 位 ， 再 将 其 对 应 的 线 的 mark_table 的 值 设 为 
MARKED。 

这 里 请 大 家 回忆 一 下 ,我们 在 分 配 时 曾经 对 小 型 对 象 进行 过 保守 的 标记 操作 。 对 于 小 型 
对 象 而 言 ， 只 要 把 它 开头 所 属 线 的 mark_table 的 值 设 为 MARKED 就 行 了 ， 没 必要 考虑 它 是 
否 占据 了 旁边 的 线 。 

当 涉 及 中 型 对 象 时 ， 则 需要 调查 与 其 对 应 的 mark_table， 将 所 有 与 其 对 应 的 线 的 mark_ 
table 的 值 设 为 MARKED。 

在 复制 操作 中 ， 备 用 From 块 里 的 对 象 会 被 复制 到 To 块 。 如 果 能 将 FREE 块 用 作 To 块 ， 
那么 就 有 可 能 收纳 From 块 里 的 所 有 活动 对 象 。 不 过 这 样 并 不 能 有 效 利 用 RECYCLABLE 块 里 
的 FREE 线 。 

为 了 选择 To 块 ， 我 们 采用 分 配 的 方法 。 也 就 是 说 ， 我 们 把 复制 操作 看 成 将 From 块 的 活 
动 对 象 新 分 配 到 别 的 地 方 。 不 过 复制 操作 不 一 定 都 会 顺利 进行 ， 我 们 需要 连续 的 FREE 线 来 
收纳 想 要 复制 的 对 象 。 如 果 堆 中 FREE 线 已 经 不 够 了 ,那么 程序 就 会 放弃 复制 操作 ， 执 行 标 
记 操 作 。 这 就 是 它 被 称 为 “投机 主义 的 玲 散 ”的 原因 。 


5.6.8 ”步骤 3 一 一 清除 阶段 


搜索 阶段 结束 后 ， 就 要 进入 清除 阶段 了 。 

在 ImmixGC 中 ， 程 序 会 以 线 为 单位 来 判断 对 象 是 活动 的 还 是 非 活动 的 。 拥 有 1 个 或 1 
个 以 上 的 活动 对 象 的 线 会 被 保留 ， 只 有 垃圾 的 线 会 被 回收 再 利用 。 

因此 ， 清 除 阶 段 中 要 搜索 各 个 块 的 mark_table。 请 大 家 回忆 一 下 ，mark_table[i] 的 
值 是 FREE、ALLOCATED 、MARKED 、CONSERVATIVE 里 面 的 任意 一 个 常量 。 

如 果 mark_table[i] 的 值 是 FREE 或 ALLOCATED， 则 line[i] 里 就 有 两 种 情况 一 一 没有 
对 象 或 只 有 垃圾 ， 因 此 这 个 线 就 能 被 回收 再 利用 了 。 如 果 mark_table[i] 的 值 是 ALLOCATED， 
则 设 定 mark_table[i] = FREE。 

图 5.27 中 列 出 了 mark_table[i] 的 值 为 FREE 时 的 情况 (a) 和 mark_table[i] 的 值 为 
ALLOCATED 时 的 情况 (b)。 
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mark_table[i—1] mark table[j] mark table[i+1] mark_table[i—1] mark table[i] mark table[i+1] 
"| 
| 人 

mark_table[i—1] mark table[i] mark table[i+1] mark_table[i—1] mark table[i] mark table[i+1] 


"i 














MARKED 

全 可 ALLOCATED 
证 ] FREE 

EE CONSERVATIVE 


mark table 的 值 











图 5.27 mark_tablel[i] 的 值 是 FREE 或 ALLOCATED 时 





下 面 是 mark_table[i] 的 值 为 MARKED 时 的 情况 ， 这 种 情况 意味 着 1ine[i] 里 的 对 象 在 
这 次 GC 的 过 程 中 存活 下 来 了 。 不 过 因为 我 们 不 知道 它们 下 次 是 能 继续 存活 还 是 成 为 垃圾 ， 所 
以 事先 要 留 下 一 个 “存在 着 对 象 "” 的 信息 ， 也 就 是 要 设 定 mark_table[i] = ALLOCATED。 

图 5.28 表示 的 是 mark_table[i] 的 值 为 MARKED 时 的 情况 。 

















mark table[i—1] mark table[i] mark table[i+1] mark table[i—1] mark table[i] mark table[i+1] 


-> 








MARKED 
| ALLOCATED 


[DO FREE 
EE CONSERVATIVE 


mark table 的 值 











5.28 mark_table[j] 的 值 为 MARKED 时 


在 清除 阶段 中 我 们 一 直 把 目光 放 在 mark_table 上 ， 但 也 不 能 忘记 线 里 的 对 象 ， 还 要 记 
得 把 在 搜索 阶段 设置 的 对 象 的 标志 位 给 取消 。 

最 后 我 们 来 想 一 下 当 mark_table[i] 的 值 为 CONSERVATIVE 时 的 情况 。 这 种 情况 意味 着 
第 (i-1) 个 线 ， 也 就 是 line[i-1] 里 的 对 象 有 可 能 也 占据 了 line[i] 的 空间 。 在 这 种 情况 下 ， 
如 果 line[i-1] 的 对 象 都 是 非 活 动 对 象 ， 就 可 以 将 line[i] 进行 回收 再 利用 。 然 而 ， 即 使 
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line[i-1] 只 有 一 个 活动 对 象 ， 这 个 对 象 也 有 可 能 占据 line [i] 的 空间 ， 所 以 这 时 就 不 能 将 
line[i] 进行 回收 再 利用 了 。 

所 以 我 们 要 调查 mark_table[i-1]。mark_table[i-1] 的 值 不 是 ALLOCATED 就 是 FREE。 如果 
mark_table[i-1] 的 值 是 ALLOCATED，1line[i-1] 里 就 可 能 存在 着 活动 对 象 , 这 时 我 们 就 
不 管 mark_table[i] 的 CONSERVATIVE 了 。 而 如 果 mark_table[i-1] 的 值 是 FREE 的 话 ， 那 
么 line[i-1] 里 就 没有 活动 对 象 了 ,我 们 也 就 可 以 把 line[i] 回收 再 利用 了 ， 此 时 mark_ 
table[i] 的 CONSERVATIVE 要 重 写成 FREE。 

图 5.29 表示 的 是 mark_table[i] 的 值 为 CONSERVATIVE 时 的 情况 。 
































mark table[i—1] mark table[j] mark table[i+1] mark _ table[i 一 1] mark table[j] mark table[i+1] 


ee , 


mark table[i—1] mark_table[i] mark table[i+1] mark table[i—1] mark_table[i] mark table[i+1] 
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mark_table 的 值 











图 5.29 mark_tablel[i] 的 值 为 CONSERVATIVE 时 


这 样 把 $block[k] .mark_table 全 部 搜索 完 之 后 ， 对 $block[k] 的 清除 操作 就 结束 了 。 
当 对 所 有 块 都 执行 完 清除 操作 时 ，GC 结 





5.6.9 ”优点 

ImmixGC 最 大 的 特征 是 将 对 象 分 为 块 和 线 两 个 阶段 进行 管理 。 

打 个 比方 ,分配 的 时 候 我 们 优先 使 用 的 是 RECYCLABLE 块 而 不 是 FREE 块 对 吧 。 这 样 一 来 
就 容易 把 对 象 安排 在 同一 个 块 里 ， 因 此 碎片 化 问题 就 得 到 了 解决 ， 同 时 也 能 将 缓存 加 以 利用 。 

不 过 男 一 方面 ， 如 果 只 以 块 为 单位 来 管理 对 象 ， 就 会 白白 浪费 很 多 堆 。 举 个 极端 的 例子 ， 
即使 1 个 块 里 只 有 1 个 活动 对 象 ， 也 必须 保留 这 个 块 里 所 有 的 残留 垃圾 。 

因此 ， 我 们 把 块 分 成 了 更 小 的 线 。 这 样 一 来 ， 就 能 更 精确 地 管理 块 里 的 对 象 ， 抑 制 堆 的 
消耗 量 。 
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此 外 ， 因 为 我 们 将 碎片 化 严重 的 块 拿 来 当 备 用 From 块 ， 所 以 可 以 有 效 地 解决 碎片 化 问题 。 
5.6.10 ”缺点 
在 Immix 的 压缩 过 程 中 ， 对 象 不 是 按 顺序 保存 的 ， 所 以 不 要 期 待 ImmixGC 能 沾 绥 存 的 光 。 
毕竟 它 只 是 为 了 防止 碎片 化 而 进行 的 压缩 。 
还 请 大 家 回忆 一 下 ,我们 曾经 做 过 保守 的 标记 。 那 些 没有 活动 对 象 的 线 有 可 能 无 法 被 回 
收 。 虽 然 我 们 对 吞吐 量 予 以 了 足够 的 重视 ， 但 却 无 法 有 效 地 使 用 堆 。 














6 


在 此 之 前 ,我 们 在 “算法 篇 ”中 介绍 了 很 多 种 GC 算法 。 而 要 想 在 处 理 程 序 中 实现 这 些 
算法 ， 处 理 程序 的 开发 者 就 必须 首先 选择 GC 的 种 类 。 这 里 的 种 类 指 的 是 “保守 式 GC 和 “ 准 
确 式 GC 








本 有 什么 是 保守 式 GC 


简单 来 说 ， 保 守 式 GC (Conservative GC ) 指 的 是 “不 能 识别 指针 和 非 指 针 的 GC”。 


6.1.1 _ 不 明确 的 根 
不 明确 的 根 (ambiguous roots ) 指 的 是 什么 呢 ? 我 们 在 第 1 章 中 讲 过 下 面 这 些 空间 都 是 根 。 





























。 调 用 栈 


“全 局 变量 空间 





事实 上 它们 都 是 不 明确 的 根 。 
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我 们 以 调用 栈 为 例 来 想 一 想 。 调 用 栈 里 面 有 调用 帧 (call frame )， 调 用 帧 里 面 装着 函数 内 
的 局 部 变量 和 参数 的 值 。 不 过 局 部 变量 中 如 果 有 C 语言 里 面 的 int 、double 这 样 的 非 指针 ( 数 
值 )， 也 就 会 有 void* 这 样 的 指针 吧 。 也 就 是 说 ,调用 帧 里 面 既 有 指针 又 有 非 指 针 。 

















调用 栈 
Oxcbf10703 














Ox0fda4754 








0xb7d8a6d0 





Oxb757eb90 G 一 


Oxb7c7b6d0 一 二 
调用 帧 


0xb73f6b90 




















0x00000324 





图 6.1 调用 栈 中 的 值 





调用 帧 里 的 值 在 GC 看 来 就 是 一 堆 位 的 排列 ， 因 此 GC 不 能 识别 指针 和 非 指 针 ， 所 以 才 
叫 作 不 明确 的 根 。 


6.1.2 ”指针 和 非 指针 的 识别 


在 不 明确 的 根 这 一 条 件 下 ，GC 不 能 识别 指针 和 非 指针 。 也 就 是 说 ， 不 明确 的 根 里 所 有 
的 值 都 有 可 能 是 指针 。 然 而 这 样 一 来 ,在 GC 时 就 会 大 量 出 现 指针 和 被 错误 识别 成 指针 的 非 
指针 。 因 此 保守 式 GC 会 检查 不 明确 的 根 ， 以 “ 某 种 程度 ”的 精度 来 识别 指针 。 

下 面 是 保守 式 GC 在 检查 不 明确 的 根 时 所 进行 的 基本 项 目 。 









































1. 是 不 是 被 正确 对 齐 的 值 ? (在 32 位 CPU 的 情况 下 ， 为 4 的 倍数 ) 
2. 是 不 是 指 着 堆 内 ? 
3. 是 不 是 指 着 对 象 的 开头 ? 








第 1 个 项 目 是 利用 CPU 的 对 齐 来 检查 的 。 如 果 CPU 是 32 位 的 话 ， 指 针 的 值 ( 地 址 ) 就 
是 4 的 倍数 ;如 果 CPU 是 64 位 的 话 ， 指 针 的 值 就 是 8 的 倍数 ; 如 果 是 其 他 情况 ， 就 会 被 识 
别 为 非 指 针 。 在 使 用 这 个 检查 项 目 时 ， 我们 必须 在 语言 处 理 程 序 中 令 要 使 用 的 指针 符合 对 齐 
规则 ， 不 符合 对 齐 规则 的 指针 会 被 GC 视 为 非 指针 。 

第 2 个 项 目 是 调查 不 明确 的 根 里 的 值 是 否 指向 作为 GC 对 象 的 堆 。 当 分 配 了 GC 专用 的 
堆 时 ， 对 象 就 会 被 分 配 到 堆 里 。 也 就 是 说 ， 指 向 对 象 的 指针 按 道理 肯定 指向 堆 内 。 这 个 检查 
项 目 就 是 利用 了 这 一 点 。 
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第 3 个 项 目 是 调查 不 明确 的 根 内 的 值 是 不 是 指 着 对 象 的 开头 。 具 体 可 以 用 我 们 在 第 2 章 
中 介绍 的 “BiBOP 法 ”等 ， 把 对 象 (在 块 中) 按照 固定 大 小 对 齐 ， 核对 检查 对 象 的 值 是 不 是 对 
象 固定 大 小 的 倍数 。 

以 上 我 们 举 出 的 3 个 项 目 是 “基本 的 检查 项 目 ”。 根 据 内 存 布 局 和 对 象 结构 等 (实现 )， 这 
些 检 查 项 目 也 会 有 所 变化 。 


6.1.3 _ 貌似 指针 的 非 指针 


当 基 于 不 明确 的 根 运行 GC 时 ,偶尔 会 出 现 非 指针 和 堆 里 的 对 象 的 地 址 一 样 的 情况 ， 这 
时 GC 就 无 法 识别 出 这 个 值 是 非 指 针 。 这 就 是 “貌似 指针 的 非 指 针 ”(false pointer)， 如 图 6.2 
所 示 。 


























根 








0x00d0caf0 0x00d0caf0 
(数值 ) (指针 ) 









貌似 指针 的 
非 指针 





6.2 ”貌似 指针 的 非 指 针 


保守 式 GC 将 这 种 “貌似 指针 的 非 指 针 ” 看 成 “指向 对 象 的 指针 ”， 我 们 把 这 种 情况 叫 作 “ 指 
针 的 错误 识别 ”。 

打 个 比方 ， 在 采用 GC 标记 - 清除 算法 的 情况 下 ,一 找到 貌似 指针 的 非 指 针 ， 程 序 就 会 
将 非 指 针 指 向 的 对 象 错误 地 识别 为 活动 对 象 ， 对 其 进行 标记 。 因 为 被 错误 识别 的 对 象 不 会 被 
废弃 而 会 被 保留 ， 所 以 遵守 了 GC 的 原则 一 一 “不 废弃 活动 对 象 ”。 像 这 样 ， 在 运行 GC 时 采 
取 的 是 一 种 保守 的 态度 ， 即 “把 可 疑 的 东西 看 作 指 针 ， 稳 受 处 理 ”， 所 以 我 们 称 这 种 方法 为 “ 保 
GO”: 
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6.1.4 “不 明确 的 数据 结构 


当 基 于 不 明确 的 根 运 行 GC 时 ， 我 们 就 要 从 对 象 的 头 部 获取 对 象 的 类 型 信息 。 打 个 比方 ， 
将 C 语言 结构 体 的 信息 作为 标志 (flag ) 放 到 对 象 的 头 里 ， 请 想象 一 下 这 种 情况 。 

如 果 能 从 头 的 标志 获得 结构 体 的 信息 (对象 的 类 型 信息 )，GC 就 能 识别 对 象 域 里 的 值 是 
指针 还 是 非 指针 。 以 C 语言 为 例 ， 所 有 的 域 里 面 都 包含 了 类 型 信息 ， 只 要 程序 员 没 有 放 人 与 
类 型 不 同 含义 的 值 ( 比 如 把 指针 转换 类 型 ， 放 入 int 类 型 的 域 )， 就 是 有 可 能 正确 识别 指针 的 。 

不 过 C 语言 的 数据 结构 要 是 像 下 面 这 样 ， 就 会 变 成 不 明确 的 数据 结构 (ambiguous data 


Structures ) 了 了 o 


























代码 清单 6.1: 不 明确 的 数据 结构 


1 | uniont{ 
2 long n; 
3 void *ptr; 


4 |} ambiguous_data; 





因为 ambiguous_data 是 联合 体 ， 所 以 它 可 能 包括 指针 ptz， 或 者 包括 非 指针 n。 如 果 n 
里 包括 “貌似 指针 的 非 指 针 ”， 那 么 GC 就 无 法 识别 出 它 是 非 指 针 。 
当 对 象 具有 这 样 的 数据 结构 时 ，GC 不 仅 会 错误 识别 不 明确 的 根 ， 也 会 错误 识别 域 里 的 值 。 


G2 (77 


语言 处 理 程序 不 依赖 于 GC 


保守 式 GC 的 优点 在 于 容易 编写 语言 处 理 程序 。 处 理 程 序 基 本 上 不 用 在 意 GC 就 可 以 编 
写 代 码 。 语 言 处 理 程序 的 实现 者 即使 没有 意识 到 GC 的 存在 ,程序 也 会 自己 回收 垃圾 。 因 此 
语言 处 理 程序 的 实现 要 比 准确 式 GC 简单 。 


6.3 


6.3.1 _ 识别 指针 和 非 指 针 需 要 付出 成 本 


识别 不 明确 的 根 和 数据 结构 的 值 为 “指针 ”或 “ 非 指针 ” 时， 我 们 需要 付出 一 定 的 成 本 。 
而 这 一 成 本 在 后 面 要 为 大 家 介绍 的 准确 式 CC 里 是 不 存在 的 。 
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6.3.2_ 错误 识别 指针 会 压迫 堆 

当 存 在 貌似 指针 的 非 指针 时 ,保守 式 GC 会 把 被 引用 的 对 象 错误 识别 为 活动 对 象 。 如 果 
这 个 对 象 存在 大 量 的 子 对 象 ， 那么 它们 一 律 都 会 被 看 成 活动 对 象 。 因 为 程序 把 已 经 死 了 的 非 
活动 对 象 看 成 了 活动 对 象 ， 所 以 垃圾 对 象 会 严重 压迫 堆 。 


6.3.3 ”能 够 使 用 的 GC 算法 有 限 

在 无 法 正确 识别 指针 的 环境 中 ， 我 们 基本 上 不 能 使 用 GC 复制 算法 等 移动 对 象 的 GC 算法 。 
就 如 我 们 之 前 在 第 4 章 中 所 讲 的 那样 ，GC 复制 算法 在 复制 对 象 的 时 候 ， 会 将 根 的 值 重 写 到 
新 空间 。 要 是 我 们 想 用 不 明确 的 根 这 么 办 的 话 ， 就 可 能 把 非 指针 重 写 了 。 此 外 ， 在 对 象 内 重 
写 指针 时 ， 也 有 可 能 因为 不 明确 的 数据 结构 而 重 写 了 非 指针 。 一 旦 重 写 了 非 指针 ， 就 会 产生 
意 想 不 到 的 BUG。 


6.4 


准确 式 GC (Exact GC ) 和 保守 式 GC 正好 相反 ， 它 是 能 正确 识别 指针 和 非 指针 的 GC。 


6.4.1 ”正确 的 根 


准确 式 GC 和 保守 式 GC 不 同 ， 它 是 基于 能 精确 地 识别 指针 和 非 指针 的 “正确 的 根 ”(exact 
roots) 来 执行 GC 的 。 

创建 正确 的 根 的 方法 有 很 多 种 ， 不 过 这 些 方法 有 个 共通 点 ， 就 是 需要 “语言 处 理 程序 的 
支援 "， 所 以 正确 的 根 的 创建 方法 是 依赖 于 语言 处 理 程序 的 实现 的 。 

本 章 中 我 们 将 为 大 家 介绍 几 种 创建 方法 ,详细 内 容 请 参考 “实现 篇 ”。 















































6.4.2 ” 打 标 签 


第 一 个 方法 是 打 标 签 (tag )， 目 的 是 将 不 明确 的 根 里 的 所 有 非 指针 都 与 指针 区 别 开 来 。 打 
标签 的 方法 种 类 繁多 ， 在 这 里 我 们 为 大 家 解说 的 是 用 最 基本 的 低 1 位 作为 标签 的 方法 。 

在 32 位 CPU 的 情况 下 ， 指 针 的 值 是 4 的 倍数 ， 低 2 位 一 定 是 0， 我 们 就 利用 这 个 特性 。 
第 3 章 中 提 到 的 1 位 引用 计数 法 曾经 将 这 部 分 用 作 计 数 右 ， 这 次 我 们 则 用 它 来 识别 指针 和 非 
指针 。 

打 标 签 的 具体 方法 如 下 所 示 。 




































































1. 将 非 指针 (int 等 ) 向 左 移动 1 位 (a << 1) 
2. 将 低 1 位 置 位 (al1) 
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打 标签 的 时 候 我 们 需要 注意 一 些 地 方 ， 比 如 在 对 数值 ( 非 指针 ) 打 标 签 时 ， 要 注意 不 要 
让 数据 溢出 。 在 向 左 移动 1 位 时 ， 如 果 数 据 港 出， 我 们 就 得 再 变换 一 个 大 的 数据 类 型 。 

如 果 用 这 种 方法 打 标 签 的 话 ， 人 处 理 程序 里 的 数值 就 会 都 是 奇数 。 因 此 ， 在 处 理 程序 内 进 
行 计算 时 ， 必 须 取 消 标签 后 再 计算 数值 。 为 此 ， 处 理 程序 在 计算 过 程 中 会 向 右 移动 1 位 ， 取 
消 标签 ， 最 后 再 跟 之 前 一 样 在 计算 结果 上 打 标 签 。 

基本 上 打 标 签 和 取消 标签 的 操作 都 是 由 语言 处 理 程序 执行 的 ， 这 就 是 我 们 之 前 所 说 的 “ 需 
要 语言 处 理 程序 支援 GC”。 

为 不 明确 的 根 里 的 所 有 非 指 针 打 标签 后 ，GC 就 能 正确 地 识别 指针 和 非 指针 了 ， 也 就 是 
我 们 所 说 的 “正确 的 根 ”。 


6.4.3 ”不 把 寄存 器 和 栈 等 当 作 根 


还 有 一 种 方法 是 不 把 寄存 器 和 栈 等 不 明确 的 根 的 关键 因素 当 作 根 ， 而 在 处 理 程序 里 创建 根 。 
具体 思路 就 是 创建 一 个 正确 的 根来 管理 ， 这 个 正确 的 根 在 处 理 程序 里 只 集合 了 mutator 
可 能 到 达 的 指针 ， 然 后 以 它 为 基础 来 执行 CC。 
举 个 例子 ， 当 语言 处 理 程 序 采用 VM (虚拟 机 ) 这 种 构造 时 ， 有 时 会 将 VM 里 的 调用 栈 和 
寄存 器 当 作 正 确 的 根来 使 用 。 我 们 将 在 “实现 篇 " 中 为 大 家 介绍 一 种 名 为 Rubinius 的 语言 处 
理 程 序 ， 它 就 采用 了 这 种 方法 ， 详 情 请 参考 第 12 章 。 


6.4.4 “优点 


首先 ， 准 确 式 GC 完全 没有 保守 式 GC 固有 的 问题 错误 识别 指针 。 也 就 是 说 ， 它 不 
会 认为 已 经 死 了 的 对 象 还 活着 。GC 之 后 ， 堆 里 只 会 留 下 活动 对 象 。 

此 外 ， 它 可 以 实现 GC 复制 算法 等 移动 对 象 的 算法 。 因 为 准确 式 GC 能 明确 识别 指针 跟 
非 指针 ， 所 以 即使 移动 对 象 ， 重 写 根 的 值 ， 这 个 对 象 也 不 可 能 是 非 指针 。 


6.4.5 ”缺点 


当 创建 准确 式 GC 时 ， 语 言 处 理 程序 必须 对 GC 进行 一 些 支 援 。 也 就 是 说 ， 在 创建 语言 
处 理 程序 时 必须 顾及 GCC。 排除 某 些 特殊 的 实现 方法 ， 这 会 给 实现 者 带 来 相当 沉重 的 负担 。 
可 见 在 处 理 程序 的 实现 上 ， 准 确 式 GC 比 保守 式 GC 麻烦 。 

此 外 ， 要 创建 正确 的 根 就 必须 付出 一 定 的 代价 ， 而 这 种 代价 在 保守 式 GC 中 是 不 存在 的 。 
好 比 打 标 签 ， 因 为 每 次 进行 计算 时 都 需要 取消 标签 ， 然 后 再 重新 设置 ， 这 就 关系 到 语言 处 理 
程序 整体 的 执行 速度 了 。 
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-对 间接 引用 


不 知道 大 家 是 否 还 记得 ， 保 守 式 GC 有 个 缺点 ， 就 是 “不 能 使 用 GC 复制 算法 等 移动 对 
象 的 算法 ”。 解 决 这 个 问题 的 方法 之 一 就 是 “间接 引用 ”。 


6.5.1 ”经 由 句柄 引用 对 象 


为 什么 在 保守 式 GC 中 无 法 使 用 GC 复制 算法 这 样 的 算法 呢 ? 大 家 可 以 想到 ， 这 是 因为 
在 重 写 不 明确 的 根 ( 或 不 明确 的 数据 结构 ) 时 ， 重 写 的 对 象 有 可 能 是 非 指针 。 

解决 这 个 问题 的 办 法 就 是 经 由 句柄 (handle) 来 间接 地 处 理 对 象 。 

从 图 6.3 中 可 以 看 出 ， 根 和 对 象 之 间 有 句柄 。 每 个 对 象 都 有 一 个 句柄 ， 它 们 分 别 持 有 指 
癌 这 些 对 象 的 指针 。 并 且 局 部 变量 和 全 局 变量 这 些 不 明确 的 根 里 没有 指向 对 象 的 指针 ， 只 装 
着 指向 句柄 的 指针 。 也 就 是 说 ， 由 mutator 操作 对 象 时 ， 要 通过 经 由 句柄 的 间接 引用 来 执行 
人 处理 (图 6.3)。 




































































对 象 句柄 





图 6.3 对象 的 间接 引用 








只 要 采用 了 间接 引用 ,那么 即使 移动 了 引用 目标 的 对 象 ， 也 不 用 改写 关键 的 值 不 
明确 的 根 的 值 ， 改 写 句 柄 里 的 指针 就 可 以 了 。 也 就 是 说 ， 我 们 只 要 采用 间接 引用 来 处 理 对 象 ， 
就 可 以 移动 对 象 。 请 大 家 留意 图 6.4， 在 复制 完 对 象 之 后 ， 根 的 值 并 没有 重 写 。 

而 且 ， 在 对 象 内 没有 经 由 句柄 指向 别 的 对 象 。 只 有 在 从 根 引用 对 象 时 ， 才 会 经 由 句柄 。 

此 外 ,使 用 了 间接 引用 的 GC 算法 不 是 准确 式 GCC。 因为 间接 引用 是 以 不 明确 的 根 为 基 
础 运行 GC 的 ， 所 以 还 是 不 能 正确 识别 指针 和 非 指针 。 也 就 是 说 ， 还 是 会 发 生 错误 识别 指针 
的 情况 ， 所 以 这 是 保守 式 GC。 
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对 象 句柄 


From 空间 


To 空间 








执行 GC 复制 算法 后 














From 空间 


To 空间 





图 6.4 ”移动 对 象 (间接 引用 的 情况 下 ) 


6.5.2 ”优点 

因为 在 使 用 间接 引用 的 情况 下 有 可 能 实现 GC 复制 算法 ， 所 以 可 以 得 到 GC 复制 算法 所 
带 来 的 好 处 ， 例 如 消除 碎片 化 等 。 详 情 请 参考 第 4 章 。 

另外 ,我 们 还 能 实现 GC 标记 - 压缩 算法 。 

6.5.3 ”缺点 


因为 必须 将 所 有 对 象 都 (经 由 句柄 ) 间 接 引 用 ， 所 以 会 拉 低 访问 对 象 内 数据 的 速度 ， 
会 关系 到 整个 语言 处 理 程序 的 速度 。 
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HO MostlyCopyingG6Cc 


1989 年 Joel F. Bartlett 4 研究 出 了 一 个 保守 式 GC 复制 算法 叫 作 MostlyCopyingCC。 
这 个 算法 能 在 不 明确 的 根 的 环境 中 运行 GC 复制 算法 。 


6.6.1 ”概要 


为 了 实现 把 Scheme 翻译 成 C 语言 的 翻译 程序 了，Bartlett 研究 出 了 MostlyCopyingGC， 以 
便 在 翻译 后 的 环境 (C 语言 ) 中 以 寄存 带 和 栈 等 不 明确 的 根 为 基础 执行 GCC。Bartlett 在 论文 里 
提出 ， 在 这 种 环境 下 能 够 实现 保守 式 GC 复制 算法 。 

简单 来 说 ，MostlyCopyingGC 就 是 “把 那些 不 明确 的 根 指向 的 对 象 以 外 的 对 象 都 复制 的 
GC 算法 ”。Mostly 是 “大 部 分 ”的 意思 。 说 白 了 ，MostlyCopyingGC 就 是 抛 开 那些 不 能 移动 的 
对 象 ， 将 其 他 “大 部 分 ”的 对 象 都 进行 复制 的 GC 算法 。 

此 外 ，MostlyCopyingGC 还 有 如 下 这 些 前 提 条 件 。 



































1. 根 是 不 明确 的 根 

2. 没有 不 明确 的 数据 结构 
3. 对 象 大 小 随意 

4.CPU 是 32 位 


关于 上 述 几 点 请 大 家 多 加 注意 。 

第 2 点 前 提 条 件 表 明了 GC 能 够 明确 判断 对 象 里 的 域 是 指针 还 是 非 指针 。 

这 里 跟 大 家 稍微 解释 一 下 第 4 点。 这 个 前 提 条 件 并 不 意味 着 MostlyCopyingGC 只 适用 于 
32 位 CPU。 为 了 在 本 小 节 中 能 简明 扼要 地 向 大 家 讲解 ， 我 们 就 以 32 位 CPU 为 前 提 了 。 


6.6.2 ” 堆 结 构 


图 6.5 所 示 为 MostlyCopyingGC 的 堆 结构 。 

堆 被 分 成 一 定 大 小 的 页 (page )。 

每 个 页 都 各 有 一 个 编号 。 那 些 没 有 分 配 到 对 象 的 空 页 则 有 一 个 $current_space 以 外 的 
编号 。 页 编号 的 大 小 必须 满足 一 个 条 件 就 算 给 所 有 空 页 都 安排 了 一 个 唯一 的 编号 ， 也 
不 会 造成 数据 浇 出 。 









































Qz 翻译 程序 : 将 某 种 语言 的 源 代 码 翻译 成 其 他 语言 的 程序 。 
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$current space 1 
$next space 1 


图 6.5 堆 结 构 


在 GC 执行 时 , 图 6.5 中 的 $current_space 和 $next_space 有 助 于 识别 To 页 (To 空间 ) 
和 From 页 (From 空间 )。 编 号 和 $ext_space 一 样 的 页 是 To 页 ， 编 号 和 $current_space 一 
羊 的 页 是 From 页 。 

因此 ，$current_space 的 值 会 被 分 配 到 装 有 对 象 的 正在 使 用 的 页 。 请 看 图 6.5， 正 在 使 
用 的 页 编号 被 设 定 为 了 1。 

一 般 情 况 下 $current_space 和 $next_space 是 同一 个 值 ， 只 有 在 GC 时 这 两 者 的 值 才 
不 相同 。 

此 外 ,我 们 还 要 为 正在 使 用 的 页 设置 以 下 两 种 标志 中 的 一 种 。 











芥 














。0BJECT 一 一 正在 使 用 的 页 
。CONTINUED 一 一 当 正 在 使 用 的 页 跨 页 时 ， 设置 在 第 2 个 页 之 后 


关于 以 上 标志 ， 我 们 会 在 之 后 的 6.6.3 节 中 详细 说 明 。 

另外 ,为 了 方便 解说 ， 我 们 把 页 编号 和 标志 都 直接 注 在 图 6.5 的 页 上 了 。 实 际 上 页 和 页 
编号 并 不 是 这 样 排列 在 内 存 里 的 。 因 为 有 时 也 会 出 现 跨 页 分 配对 象 的 情况 ， 所 以 从 实现 上 来 
说 ,我 们 必须 把 页 和 标志 分 别 在 不 同 的 内 存 位 置 进行 管理 。 




















6.6 MostlyCopyingGC 


6.6.3 ”分配 

根据 分 块 的 大 小 、 分 配 的 对 象 的 大 小 不 同 ,分 配 的 动作 也 各 不 相同 。 

如 果 正 在 使 用 的 页 里 有 符合 mutator 申请 的 对 象 大 小 的 分 块 ， 对 象 就 会 被 分 配 到 这 个 页 (图 
6.6)。 

















当 正 在 使 用 的 页 里 分 抉 大 小 充足 时 









































[= 己 己 
ee | 
$current_space 1 $current_space 1 
$next_space 1 $next_space 1 


图 6.6 分 配对 象 (分 块 大 小 充足 ) 


另 一 方面 ， 当 正在 使 用 的 页 里 没有 大 小 充足 的 分 块 时 ， 对 象 就 会 被 分 配 到 空 的 页 ， 然 后 
正在 使 用 的 这 个 新 页 会 被 设置 0BJECT 标志 (图 6.7)。 














当 正 在 使 用 的 页 里 分 块 大 小 不 足 时 


| 


$current_space 1 $current space 1 
$next space 1 $next_ space 1 





想 分 配 的 对 象 

















图 6.7 分 配对 象 (分 块 大 小 不 足 ) 


另外 ，mutator 可 能 会 申请 分 配 超过 页 大 小 的 空间 。 当 mutator 要 求 大 对 象 时 ,分 配 程序 
会 将 对 象 跨 多 个 页 来 分 配 。 在 跨 多 个 页 分 配 时 ， 和 平时 的 分 配 一 样 ， 也 会 在 开头 的 页 设 定 
0BJECT， 然 后 在 第 2 个 页 之 后 设置 CONTINUED 标志 。 有 具体 情况 如 图 6.8 所 示 。 
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想 分 配 的 对 旬 





$current space 1 
$next space 1 








图 6.8 分 配 大 对 象 


6.6.4 new_obj() 函 数 
下 面 让 我 们 基于 上 一 节 的 内 容 ， 来 看 看 分 配 的 伪 代 码 吧 。 


代码 清单 6.2: new_obj() 函数 





1 | new_obj(size){ 

2 while(size > $free_size) 
3 $free_size = 0 

4 add_pages(byte_to_page_num(size)) 
5 

6 obj = $free 

7 obj.size = size 

8 

9 if(size < PAGE_SIZE) 

10 $free_size -= size 

让 $free += size 

12 else 

13 $free_size = 0 

14 

15 return obj 

16 | 二 





我 们 把 想 分 配 的 对 象 大 小 ( 字 节 数 ) 传 给 new_obj () 函数 (代码 清单 6.2) 的 第 1 个 参数 。 

在 第 2 行 出 现 的 全 局 变量 $free_size 是 用 来 保持 分 块 大 小 的 。 如 果 $free_size 小 于 
mutator 申请 的 大 小 (size )， 那么 add_pages() 函数 就 会 分 配 新 的 页 ， 扩 大 分 块 大 小 。 然 后 ， 
新 分 配 的 页 数 会 被 传递 给 add_pages() 函数 。 关 于 这 个 函数 ,我 们 会 在 接 下 来 的 6.6.5 节 为 

















6.6 MostlyCopyingGC 


大 家 说 明 。 

第 6 行 的 全 局 变量 $free 指向 分 块 的 开头 。 我 们 将 obj 设 定 成 $free。 

第 9 行 则 是 调查 size 是 否 小 于 页 大 小 (PAGE_SIZE)。 当 size 小 于 页 大 小 时 ， 则 会 从 
$free_size 的 值 中 减 去 size 的 值 ， 修 正 $free 指向 的 位 置 。 

如 果 mutator 申请 的 大 小 超过 页 大 小 ,那么 就 得 把 $free_size 归 0。 这 样 一 来 ， 对 象 就 
不 会 被 分 到 设置 有 CONTINUED 的 页 了 。 为 什么 不 能 把 对 象 分 配 到 设置 有 CONTINUED 的 页 呢 ? 
我 们 会 在 后 面 的 6.6.8 节 中 为 大 家 说 明 。 


6.6.5 ”add_pages() 函数 
下 面 我 们 来 看 一 下 负责 新 分 配 页 的 add_pages() 也 数 。 这 个 也 数 是 在 new_obj () 函数 
内 部 调用 的 函数 。 






































代码 清单 6.3: add_pages() 函数 





1 | add_pages (page_num){ 

2 if($allocated_page_num + page_num >= HEAP_PAGE_NUM/2) 
3 mostly_copying() 

4 return 

5 

6 first_free_page = find_free_pages(page_num) 
7 

8 if(first_free_page == NULL) 

9 allocation_fail() 
10 
14 if($next_space != $current_space) 
12 enqueue (first_free_page, $to_space_queue) 
13 
14 allocate_pages(first_free_page, page_num) 
15 |} 


在 add_pages() 函数 (代码 清单 6.3) 中， 将 追加 的 页 数 作为 参数 。 

第 2 行 的 全 局 变量 $allocated_page_nunm 中 保存 着 现在 正在 使 用 的 页 数 。 此 外 ，HEAP_ 
PAGE_NUM 中 保存 着 堆 中 的 总 页 数 。 如 果 出 现 “ 正 在 使 用 的 页 十 准备 追加 的 页 > 总 页 的 一 半 ” 
的 情况 ， 则 程序 会 调用 mostly_copying() 函数 ， 开 始 运行 GCC。 

第 6 行 则 是 调用 find_free_pages() 子 数 ,在 堆 内 寻找 page_num 数量 的 连续 的 空 页 。 
这 个 函数 的 返回 值 是 指向 所 发 现 的 空 页 (如 果 空 页 有 多 个 的 话 则 指向 开头 的 页 ) 的 指针 。 如 
果 返 回 值 是 NULL 的 话 ， 则 分 配 失 败 。 

当 运 行 GC 复制 对 象 时 , 为 了 使 用 new_obj( 函数 ,也 会 在 GC 里 调用 这 个 add_ 
pages() 函数 。 男 外 ， 第 11 行 的 条 件 只 有 在 GC 里 才 为 真 。 
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在 之 后 的 第 12 行 ， 把 GC 中 新 分 配 的 页 连接 上 $to_space_queue。 当 GC 执行 时 ， 在 这 
里 连接 上 $to_space_quenue 的 页 会 被 用 作 To 页 。 

第 14 行 是 对 那些 用 find_free_pages() 函数 找到 的 空 页 调用 allocate_pages() 函数 ， 
实际 分 配 页 。 


代码 清单 6.4: allocate_pages() 函数 

















1 | allocate_pages(first_free_page, page_num){ 
2 $free_page = first_free_page 

3 $free = first_free_page 

4 $free_size = page_num*PAGE_SIZE 

5 $allocated_page_num += page_num 

6 

7 set_space_type(first_free_page, $next_space) 
8 set_allocate_type(first_free_page，0BJECT) 
9 

10 while(--page_num > 0) 

二 $free_page = next_page($free_page) 

12 set_space_type($free_page, $next_space) 
13 set_allocate_type($free_page, CONTINUED) 
14 

15 $free_page = next_page($free_page) 

16 |} 





allocate_pages() 函数 (代码 清单 6.4) 将 指向 空 页 的 指针 和 分 配 的 页 数 用 作 参 数 。 

在 第 7 行 用 set_space_type() 函数 将 新 的 空 页 的 编号 设置 成 $next_space 的 值 。 也 
就 是 说 ， 只 要 在 GC 里 ， 这 个 页 就 会 被 看 成 是 To 页 。 此 外 ,在 第 8 行 还 用 set_allocate_ 
type() 函数 给 页 设置 了 0BJECT 标志 。 

第 10 行 的 循环 只 在 分 配 的 页 数 大 于 等 于 2 的 时 候 有 效 。 第 11 行 的 next_space() 函数 
用 来 返回 被 用 作 参 数 的 页 的 下 一 个 页 。 


6.6.6 ”GC 执行 过 程 


关于 对 象 的 分 配 ， 大 家 已 经 有 了 一 定 的 了 解 。 那 么 下 面 我 们 就 来 讲 一 下 MostlyCopyingGC 
的 执行 过 程 吧 。 

图 6.9 表示 的 是 GC 开始 前 堆 的 状态 。 这 时 $current_space 和 $next_space 的 值 是 相 
同 的 。 

假设 就 以 这 个 状态 开始 GC。 首 先 对 $next_space 的 值 进行 增 量 。 一旦 GC 开始 执行 ， 
跟 $current_space 值 (编号 ) 相 同 的 页 就 是 From 页 ， 跟 $next_space 值 相同 的 页 就 是 To 页 。 






























































6.6 MostlyCopyingGC 

























$current space 1 
$next space 1 


图 6.9 初始 状态 


之 后 我 们 将 那些 保留 有 从 根 引 用 的 对 象 的 页 “晋升 ”(promotion ) 到 To 页 ， 请 看 图 6.10。 
这 里 的 晋升 指 的 是 将 页 的 编号 设 定 为 $next_space 的 值 ， 把 它们 当成 To 页 来 处 理 。 















亚 和 到 To 空间 


2 | OBJECT 























S$current space 1 
$next space 2 


图 6.10 将 从 根 引 用 的 页 晋升 


de 


在 图 6.10 中 ， 因 为 A 对 象 是 从 根 引 用 的 ， 所 以 我 们 将 保留 有 该 对 象 的 页 编号 设 定 为 
$next_space 的 值 ， 即 2。 
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把 所 有 从 根 引 用 的 页 都 晋升 以 后 ， 下 面 就 该 把 To 页 里 对 象 的 子 对 象 复制 到 空 页 了 。 这 
时 候 从 Y( 垃 圾 对 象 ) 引 用 的 D 也 会 被 复制 过 去 。 然 后 , 空 页 的 编号 会 被 设 定 为 $next_ 
spaceo 也 就 是 说 ， 这 个 页 也 会 变 成 To 页 。 

由 图 6.11 可 知 ，C 被 复制 的 页 的 编号 被 设 定 成 了 $aext_space 的 值 。 




















$current space 1 
$next_space 2 


图 6.11 C、D 被 复制 后 


接 下 来 ,我 们 要 把 新 追加 的 To 页 里 的 对 象 的 子 对 象 复制 到 To 页 的 分 块 里 。 如 果 To 页 
里 没有 分 块 ， 那 么 对 象 就 会 被 复制 到 空 页 ， 目 标 页 的 编号 会 被 设 定 为 $next_space， 并 被 作 
为 To 页 。 

在 图 6.12 中 ， 因 为 To 页 里 有 分 块 ， 所 以 被 复制 到 了 这 个 空间 。 





6.6 MostlyCopyingGC 












编号 ?| |oBrEcT | 








$current space 1 
$next space 2 


6.12 E 被 复制 之 后 





将 To 页 里 的 所 有 子 对 象 复制 完毕 后 ，GC 就 结束 了 。 这 时 程序 会 将 $current_space 的 值 
设 定 为 $next_space 的 值 。 由 图 6.13 可 知 ，$current_space 和 $next_space 的 值 是 一 样 的 。 














[编号 2 [| oprEcr | 








$current space 2 
$next space 2 


图 6.13 GC 结束 后 





不 过 好 好 看 看 图 6.13， 其 实 垃圾 对 象 X、Y、D 都 没有 被 回收 。 实 际 上 这 就 是 MostlyCopyingGC 
的 特殊 之 处 。MostlyCopyingGC 有 个 特点 ， 就 是 不 会 回收 包含 有 从 根 指向 的 对 象 (图 中 的 和 ) 
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的 页 里 的 垃圾 对 象 ， 而 且 也 不 会 回收 这 个 垃圾 对 象 所 引用 的 对 象 群 。 举 个 极端 的 例子 ， 如 果 
所 有 的 页 里 都 有 从 根 引 用 的 对 象 ， 那么 所 有 的 垃圾 都 不 能 被 回收 。 

这 个 缺点 可 以 通过 调整 页 大 小 得 到 改善 。 如 果 缩 小 页 ， 那 么 即使 页 里 的 对 象 是 从 根 引 用 
的 ， 我 们 也 能 把 损失 降 到 最 低 。 不 过 如 果 页 太 小 了 ， 就 会 增加 页 总 数 ， 增 大 分 配 和 GC 所 需 
要 的 成 本 。 所 以 将 页 调整 到 合适 大 小 是 非常 关键 的 。 据 文献 中 记载 ， 有 试验 结果 表明 页 的 
合适 大 小 在 512 字 节 。 


6.6.7 mostly_copying() 函数 
那么 我 们 来 看 看 GC 的 伪 代 码 吧 。 


代码 清单 6.5: mostly_copying() 函数 












































1 | mostly_copying(){ 

2 $free_size = 0 

3 $allocated_page_num = 0 

4 $next_space = ($current_space + 1) %» N 
5 

6 for(r : $roots) 

7 promote_page (obj_to_page(*r)) 

8 

9 while(is_empty($to_space_queue) == FALSE) 
10 page_scan(dequeue($to_space_queue)) 
二 

12 $current_space = $next_space 

13 | } 








mostly_copying() 函数 (代码 清单 6.5) 是 执行 MostlyCopyingGC 的 子 数 ， 它 是 由 adqd_ 
pages() 函数 (代码 清单 6.3 ) 调 用 的 。 

在 第 2 行 中 ， 为 了 不 把 对 象 复制 到 From 页 的 分 块 里 去 ,将 GC 开始 时 From 页 里 的 分 块 
大 小 设 为 0。 

在 第 4 行 , 将 $next_space 进行 增 量 。 为 了 避免 $next_space 数据 洪 出 ,在 对 $next_ 
space 进行 增 量 时 ， 我 们 必须 用 常量 N 取 余 。 

此 外 ，MostlyCopyingGC 不 会 特意 把 因 GC 而 变 成 空 页 的 页 编号 归 0。 由 图 6.13 可 知 ， 
空 页 的 编号 仍 为 1。 因 此,， 空 页 的 编号 可 能 会 很 混乱 。 为 此 ， 常 量 W 的 数值 必须 要 比 空 页 
的 总 数 大 得 多 ， 以 保证 即使 给 所 有 空 页 分 配 唯 一 的 编号 ， 程 序 也 能 识别 编号 被 设 为 $next_ 
space 的 页 和 其 他 的 页 。 

在 第 6 行 和 第 7 行 ， 将 保留 有 从 根 引用 的 对 象 的 页 晋升 。obj_to_page() 函数 将 对 象 用 作 
参数 ， 返 回 保留 此 对 象 的 页 。 关 于 promote_page() 函数 ， 我 们 将 在 下 面 的 6.6.8 节 中 进行 说 明 。 
































6.6 MostlyCopyingGC 

















第 9 行 和 第 10 行 是 对 To 页 里 对 象 的 子 对 象 进行 复制 处 理 。 除 去 CONTINUED 页 ， 所 有 的 


To 页 都 连接 到 了 $to_space_queue。 我 们 将 其 一 个 一 个 地 取出 并 传递 给 page_scan() 函数 。 


6.6.8 ”promote_page() 函数 





promote_page() 函数 (代码 清单 6.6) 是 将 用 作 参 数 的 页 晋升 的 函数 。 如 果 用 作 参 数 的 页 


里 的 对 象 跨 了 多 个 页 ， 那么 这 些 页 都 会 被 一 起 晋升 。 


代码 清单 6.6: promote_page() 函数 


OO OO 人 oD Pre 


大 
Len 人 


promote_page (page){ 
if(is_page_to_heap(page) == TRUE && 
space_type(page) == $current_space && 
allocate_type (page) == 0BJECT) 


promote_continued_page (next_page (page)) 
set_space_type(page, $next_space) 


$allocated_page_numt++ 


enqueue (page, $to_space_queue) 





} 





第 2 行 、 第 3 行 、 第 4 行 用 来 检查 用 作 参 数 的 页 是 否 满足 以 下 条 件 。 


。 是 否 在 堆 内 
。 页 编号 是 否 和 $current_space 相同 
。 页 是 否 有 0BJECT 标 志 


在 第 6 行 调用 promote_continued_page() 函数 ， 晋 升 后 面 的 页 。 详 细 的 处 理 情 况 如 代 


码 清单 6.7 所 示 。 


代码 清单 6.7: promote_continued_page() 函数 


1 


NO a WwW DD 


promote_continued_page (page)t{ 
while(space_type(page) == $current_space && 
allocate_type (page) == CONTINUED) 
set_space_type(page, $next_space) 
$allocated_page_numt++ 


Page = next_page(page) 





} 


在 第 8 行 到 第 10 行 ,晋升 page， 连 接 到 $to_space_queue。 
第 2 行 和 第 3 行 用 来 调查 用 作 参 数 的 页 编号 是 和 否 为 $current_space， 以 及 是 和 否 设 置 了 








CONTINUED 标志 。 如 果 为 真 ， 则 用 作 参 数 的 页 里 的 对 象 跨 了 多 个 页 ， 这 时 令 其 全 部 晋升 。 
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在 6.6.4 节 ， 我 们 使 对 象 不 被 分 配 到 CONTINUED 页 ， 其 原因 就 在 于 代码 清单 6.7 的 第 4 
行 到 第 6 行 。 如 果 我 们 允许 把 对 象 分 配 到 CONTINUED 页 ， 那 么 对 象 就 有 可 能 跨 多 个 页 。 此 时 ， 
CONTINUED 页 的 下 一 个 页 可 能 会 被 设置 CONTINUED 标志 ， 晋 升 本 来 没 想 晋 升 的 页 。 此 外 ， 
为 CONTINUED 的 页 不 会 被 $to_space_queue 执行 enqueue()， 所 以 page_scan() 子 数 不 会 
被 调用 。 因 此 ， 即 使 我 们 把 对 象 分 配 到 CONTINUED 页 ， 这 个 对 象 也 不 会 被 复制 。 


6.6.9 page_scan() 函 数 
把 那些 持 有 从 根 引 用 的 对 象 的 页 全 部 晋升 后 ， 下 面 就 要 复制 To 页 里 的 对 象 的 子 对 象 了 。 
page_scan() 函数 (代码 清单 6.8) 是 通过 mostly_copying() 函数 调用 的 函数 。 这 个 函 

数 只 接收 To 页 作为 参数 。 


代码 清单 6.8: page_scan() 函数 
1 | page_scan(to_page){ 




















2 for(obj : objects_in_page(to_page)) 
3 for(child : children(obj)) 

4 *child = copy(*child) 

5 | 了 


这 个 函数 被 用 于 将 页 里 所 有 对 象 的 子 对 象 都 交 给 copy() 函数 ， 并 把 对 象 内 的 指针 都 改 
写成 目标 空间 的 地 址 。 


6.6.10 ”copy() 函数 
copy() 函数 (代码 清单 6.9 ) 将 复制 对 象 用 作 参 数 。 
代码 清单 6.9: copy() 函数 


copy (obj)t{ 
if(space_type(obj_to_page(obj)) == $next_space) 


J 


return obj 


if (obj.field1 != COPIED) 
to = new_obj(obj.size) 
copy_data(to, obj, obj.size) 
obj.fieldl = COPIED 
obj.field2 = to 


OO OOD 


> 2 
”© 


return obj.field2 
} 





上 
Dh 



































在 第 2 行 检查 持 有 obj 的 页 是 否 为 To 页 。 如 果 obj 在 To 页 里 ， 就 不 会 被 复制 ， 而 是 被 
直接 返回 。 
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在 第 5 行 检查 对 象 是 否 已 复制 完毕 。 如 果 复 制 完 毕 ， 则 在 第 11 行 返回 forwarding 指针 。 

如 果 没 有 复制 完毕 ， 则 用 new_obj () 函数 按 复制 对 象 的 大 小 来 分 配 空间 ， 把 对 象 的 数据 
复制 到 这 个 空间 里 ， 然 后 将 目标 空间 的 地 址 作为 forwarding 指针 纳入 field2 里 。 

接 下 来 只 要 返回 目标 空间 的 地 址 ，copy() 函数 就 结束 了 。 


_6611 优 束 和 负 吕 
说 起 MostlyCopyingGC 的 优点 ， 首 先 就 是 能 在 保守 式 GC 里 使 用 GC 复制 算法 。 也 就 是 说 ， 
使 用 MostlyCopyingGC 的 话 ， 能 够 直接 继承 GC 复制 算法 的 优点 。 
话说 回来 ， 当 然 它 的 缺点 也 跟 GC 复制 算法 很 像 。MostlyCopyingGC 特有 的 缺点 就 是 ， 
在 包含 有 从 根 引 用 的 对 象 的 页 内 ， 所 有 的 对 象 都 会 被 看 成 活动 对 象 。 也 就 是 说 ， 垃 圾 对 象 也 
会 被 看 成 活动 对 象 ， 这 样 一 来 就 拉 低 了 内 存 的 使 用 效率 。 


保守 式 GC 的 缺点 之 一 就 是 指针 的 错误 识别 ， 即 本 来 应 该 被 看 作 垃 圾 的 对 象 却 被 保留 
下 来 。 改 善 这 个 问题 的 办 法 就 是 采用 Hans J. Boehm 03 发 明 的 黑 名 单 。 


6.7.1 _ 指针 的 错误 识别 带 来 的 害处 


在 指针 的 错误 识别 中 ,被 错误 判断 为 活动 对 象 的 那些 垃圾 对 象 的 大 小 及 内 容 至 关 重 要 。 
具体 来 说 ， 主 要 有 下 面 几 项 。 



































1. 大 小 
2. 子 对 象 的 数量 


首先 是 大 小 。 打 个 比方 ， 有 个 巨大 的 对 象 死 掉 了 ， 而 保守 式 GC 却 把 它 错误 识别 成 “ 它 
还 活着 "， 这 样 当然 就 会 压迫 到 堆 了 。 

然后 是 子 对 象 的 数量 。 就 算 保守 式 GC 错误 识别 了 一 个 子 对 象 也 没有 的 小 对 象 ， 由 此 带 
来 的 损失 也 并 不 大 。 对 于 整个 堆 来 说 ， 留 下 一 个 对 象 并 不 会 有 什么 大 的 影响 。 

但 是 要 换 成 错误 识别 了 有 一 堆 子 对 象 的 对 象 ， 这 损失 就 大 了 。 保守 式 GC 会 错误 识别 子 
对 象 的 子 对 象 ， 以 及 子 对 象 的 子 对 象 的 子 对 象 ， 错 误 就 会 像 多 米 诺 骨 牌 一 样 连续 下 去 。 
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指针 的 错误 识别 


被 错误 识别 为 “活着 ”的 对 象 群 





图 6.14 连续 识别 错误 


6.7.2 ” 黑 名 单 


顾名思义 ， 黑 名 单 就 是 一 种 创建 “需要 注意 的 地 址 的 名 单 ” 的 方法 。 这 个 黑 名 单 里 记录 
的 是 “不 明确 的 根 内 的 非 指 针 ， 其 指向 的 是 有 可 能 被 分 配对 象 的 地 址 ”。 我 们 将 这 项 记录 操 
作 称 为 “ 记 和 人 黑 名 单 ”。 

有 可 能 被 分 配对 象 的 地 址 指 的 又 是 什么 呢 ? 举 个 有 代表 性 的 例子 ， 就 是 “ 堆 内 未 使 用 的 
对 象 的 地 址 ”。 

mutator 无 法 引用 至 今 未 使 用 过 的 对 象 。 也 就 是 说 ， 如 果 根 里 存在 有 这 种 地 址 的 指针 ， 
那 它 肯 定 就 是 “ 非 指 针 ”， 就 会 被 记 和 人 黑 名 单 中 。 

我 们 在 GC 标记 - 清除 算法 中 的 mark() 函数 里 导 人 记 入 黑 名 单 的 操作 ， 其 伪 代 码 如 代 
码 清单 6.10 所 示 。 
代码 清单 6.10: mark() 函数 


mark(obj){ 
if($heap_start <= obj && obj <= $heap_end) 






























































4 


2 

3 if(!is_used_object (obj)) 

4 obj.next = $blacklist 

5 $blacklist = obj 

6 else 

7 if(obj.mark == FALSE) 

8 obj.mark = TRUE 

9 for(child : children(obj)) 
10 mark(*child) 

4 | 二 





如 果 用 作 参 数 的 对 象 正 在 使 用 中 ， 那 么 第 3 行 的 is_used_object() 因数 会 返回 真 。 
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此 外 ，GC 开始 时 黑 名 单 会 被 丢弃 。 也 就 是 说 ， 在 标记 阶段 需要 注意 的 地 址 会 被 记录 在 
新 的 黑 名 单 里 。 


6.7.3 ”面向 黑 名 单 内 的 地 址 的 分 配 


黑 名 单 里 记录 的 是 “需要 注意 的 地 址 ”。 一 旦 分 配 程序 把 对 象 分 配 到 这 些 需 要 注意 的 地 址 中 ， 
这 个 对 象 就 很 可 能 被 非 指针 值 所 引用 。 也 就 是 说 ， 即 使 分 配 后 对 象 成 了 垃圾 ， 也 很 有 可 能 被 
错误 识别 成 “ 它 还 活着 ”。 

为 此 ， 在 将 对 象 分 配 到 需要 注意 的 地 址 时 ， 所 分 配 的 对 象 有 着 如 下 限制 条 件 。 
































。 小 对 象 
。 没 有 子 对 象 的 对 象 


为 什么 只 能 分 配 上 述 这 样 的 对 象 呢 ? 因为 如 果 这 样 的 对 象 成 了 垃圾 ， 即 使 被 错误 识别 了 ， 
也 不 会 有 什么 大 的 损失 。 
因为 它们 足够 小 ， 也 没有 子 对 象 ， 所 以 能 把 对 堆 的 压迫 控制 在 最 低 限 度 。 


6.7.4 ”优点 和 缺点 


这 样 一 来 ， 保 守 式 GC 因 错 误 识 别 指针 而 压迫 堆 这 个 保守 式 GC 的 一 大 问题 就 得 到 了 缓解 ， 
堆 的 使 用 效率 也 得 到 了 提升 。 因 此 ， 这 里 的 GC 对 象 少 于 通常 的 保守 式 GC 里 的 对 象 ，GC 的 
执行 速度 也 大 大 提升 了 。 

不 过 相应 地 ， 在 分 配对 象 时 则 需要 花 功夫 来 检查 黑 名 单 。 











人 分 代 垃圾 回收 





分 代 垃 圾 回收 (Generational GC ) 在 对 象 中 导入 了 “年 龄 ”的 概念 ， 通 过 优先 回收 容 
易 成 为 垃圾 的 对 象 ， 提 高 垃圾 回收 的 效率 。 


yowh 
(wea Kk ) 


((《 





J 


[和 几 什 么 是 分 代 垃圾 回收 


7.1.1 ”对 象 的 年 龄 TU 

人 们 从 众 例 中 总 结 出 了 一 个 经 验 ;“ 大 部 分 的 对 象 在 生成 后 马上 就 变 成 了 垃圾 ， 

很 少 有 对 象 能 活 得 很 久 。” 分 代 垃 圾 回收 利用 该 经 验 ， 在 对 象 中 导 人 了“ 年龄 ” 的 概念 ， 经 历 
ea EC ee 1 岁 。 
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7.1.2 ”新 生 代 对 象 和 老年 代 对 象 


分 代 垃 圾 回收 中 把 对 象 分 类 成 几 代 ， 针 对 不 同 的 代 使 用 不 同 的 GC 算法 ， 我们 把 刚 生 成 
的 对 象 称 为 新 生 代 对 象 ， 到 达 一 定年 龄 的 对 象 则 称 为 老年 代 对 象 。 

众所周知 ， 新 生 代 对 象 大 部 分 会 变 成 垃圾 。 如 果 我 们 只 对 这 些 新 生 代 对 象 执 行 GC 会 怎 
么 样 呢 ? 除了 引用 计数 法 以 外 的 基本 算法 ， 都 会 进行 只 寻找 活动 对 象 的 操作 (如 GC 标记 - 
清除 算法 的 标记 阶段 和 GC 复制 算法 等 ) 因此 ， 如 果 很 多 对 象 都 会 死去 ， 花 费 在 GC 上 的 时 
间 应 该 就 能 减少 。 

我 们 将 对 新 对 象 执 行 的 GC 称 为 新 生 代 GC (minor GC )。minor 在 这 里 的 意思 是 “小 规模 的 ”。 
新 生 代 GC 的 前 提 是 大 部 分 新 生 代 对 象 都 没 存活 下 来 ，GC 在 短 时 间 内 就 结束 了 。 

另 一 方面 ， 新 生 代 GC 将 存活 了 一 定 次 数 的 新 生 代 对 象 当 作 老 年 代 对 象 来 处 理 。 我 们 把 
类 似 于 这 样 的 新 生 代 对 象 上 升 为 老年 代 对 象 的 情况 称 为 晋升 (promotion)。 

因为 老年 代 对 象 很 难 成 为 垃圾 ， 所 以 我 们 对 老年 代 对 象 减少 执行 GC 的 频率 。 相 对 于 新 
生 代 GC， 我 们 将 面向 老年 代 对 象 的 GC 称 为 老年 代 GC (major GC )。 

在 这 里 有 一 点 需要 注意 ， 那 就 是 分 代 垃 圾 回收 不 能 单独 用 来 执行 GCC。 我 们 需要 把 它 和 
之 前 介绍 的 基本 算法 结合 在 一 起 使 用 ,来 提高 那些 基本 算法 的 效率 。 

也 就 是 说 ,分 代 垃 圾 回收 不 是 跟 GC 标记 - 清除 算法 和 GC 复制 算法 并 列 在 一 起 供 我 们 
选择 的 算法 ， 而 是 需要 跟 这 些 基 本 算法 一 并 使 用 。 

下 一 节 将 会 为 大 家 介绍 由 David Ungar 研究 出 来 的 把 GC 复制 算法 和 分 代 垃 圾 回收 这 两 
者 组 合 运用 的 方法 1。 


克 届 Ungar 的 分 代 垃 圾 回收 


7.2.1 _ 堆 的 结构 


在 Ungar 的 分 代 垃 圾 回收 中 ， 堆 的 结构 如 图 7.1 所 示 。 我 们 总 共 需 要 利用 4 个 空间 ,分 
别 是 生成 空间 、2 个 大 小 相等 的 幸存 空间 以 及 老年 代 空 间 ， 并 分 别 用 $new_start、 $survivor1_ 
start、$survivor2_start、$old_start 这 4 个 变量 引用 它们 的 开头 。 我 们 将 生成 空间 和 到 
存 空间 合 称 为 新 生 代 空间 。 新 生 代 对 象 会 被 分 配 到 新 生 代 空间 ， 老 年 代 对 象 则 会 被 分 配 到 老 
年 代 空间 里 。Ungar 在 论文 里 把 生成 空间 、 幸 存 空 间 以 及 老年 代 空间 的 大 小 分 别 设 成 了 140K 
字 节 、28K 字 节 和 940K 字 节 。 

此 外 我 们 准备 出 一 个 和 堆 不 同 的 数组 ， 称 为 记录 集 (remembered set)， 设 为 $rs。 


























































































































Q@ 也 有 另 一 种 说 法 叫 作 老年 化 (tenuring )。 
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» $new_ start 


$survivorl] start 
$survivor2 start 
全 $old_start 堆 


生成 空间 ”幸存 空间 
新 生 代 空间 





图 7.1 











生成 空间 就 如 它 的 字面 意思 一 样 ， 


空间 满 了 的 时 候 ， 新 生 代 GC 就 会 启动 ， 将 生成 空 




















算法 是 一 个 道理 。 目 标 空间 是 幸存 空间 。 
2 个 幸存 空间 和 GC 复制 算法 里 的 From 3 
在 每 次 执行 新 生 代 GC 的 时 候 ， 
使 用 的 幸存 空间 作为 From 幸存 空 
不 过 新 生 代 GC 也 必须 复制 生成 空 
这 两 个 空间 里 的 活动 对 象 都 会 被 复制 到 To 幸存 空 


是 生成 对 象 的 空 


空间 、To 2 
活动 对 象 就 会 被 复制 到 另 一 个 幸存 空 
sx 间 ， 将 没有 使 用 的 幸存 空 
间 里 的 对 象 。 也 就 是 说 ， 生 成 空 


老年 代 空间 





堆 结构 





x 间 ， 也 就 是 进行 分 配 的 空间 。 当 生成 
间 中 的 所 有 活动 对 象 复制 ， 这 跟 GC 复制 


空间 很 像 ， 我 们 经 常 只 利用 其 中 的 一 个 。 
s 间 里 。 在 此 我 们 将 正在 
s 间 作为 To 幸存 空间 。 

间 和 From 幸存 空间 
3 间 里 去 。 这 就 是 新 生 代 GC。 


























只 有 从 一 定 次 数 的 新 生 代 GC 中 存活 下 来 的 对 象 才 会 得 到 晋升 ， 也 就 是 会 被 复制 到 老年 


代 空 间 去 。 


Ungar 的 分 代 垃 圾 回收 中 ， 新 生 代 GC 的 示意 图 如 图 7.2 所 示 。 
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生成 空间 From 幸 存 空 间 To 幸存 空间 

















生成 空间 To 幸存 空间 From 幸 存 空 间 

















生成 空间 From 幸 存 空 间 To 幸存 空间 


图 7.2 Ungar 的 分 代 垃圾 回收 中 新 生 代 GC 的 示意 图 








在 执行 新 生 代 GC 时 有 一 点 需要 注意 ， 那 就 是 我 们 必须 考虑 到 从 老年 代 空 间 到 新 生 代 空 
间 的 引用 。 新 生 代 对 象 不 只 会 被 根 和 新 生 代 空 3 间 引 用 ， 也 可 能 被 老年 代 对 象 引用 。 因 此 ， 除 
了 一 般 GC 里 的 根 ， 我 们 还 需要 将 从 老年 代 空 间 的 引用 当 作 根 ( 像 根 一 样 的 东西 ) 来 处 理 。 














新 生 代 空间 老年 代 空间 


图 7.3 从 老年 代 空间 引用 新 生 代 空间 
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分 代 垃 圾 回收 的 优点 是 只 将 垃圾 回收 的 重点 放 在 新 生 代 对 象 身上 ， 以 此 来 缩减 GC 所 需 
要 的 时 间 。 不 过 考虑 到 从 老年 代 对 象 的 引用 ， 结 果 还 是 要 搜索 堆 中 的 所 有 对 象 ， 这 样 一 来 就 
大 大 削减 了 分 代 垃 圾 回收 的 优势 。 

因此 我 们 才 利 用 如 图 7.1 所 示 的 数组 一 一 记录 集 。 记 录 集 用 来 记录 从 老年 代 对 象 到 新 生 
代 对 象 的 引用 。 这 样 在 新 生 代 GC 时 就 可 以 不 搜索 老年 代 空间 的 所 有 对 象 ， 只 通过 搜索 记录 
集 来 发 现 从 老年 代 对 象 到 新 生 代 对 象 的 引用 。 关 于 记录 集 ， 我 们 会 在 下 一 节 中 为 大 家 详细 说 明 。 

那么 , 通过 新 生 代 GC 得 到 晋升 的 对 象 把 老年 代 空间 占 满 后 ， 就 要 执行 老年 代 GC 了 。 
老年 代 GC 没什么 难 的 地 方 ， 它 只 用 到 了 我 们 在 第 2 章 中 介绍 过 的 GC 标记 - 清除 算法 。 

7.2.2 ”记录 集 

记录 集 被 用 于 高 效 地 寻找 从 老年 代 对 象 到 新 生 代 对 象 的 引用 。 具 体 来 说 ， 在 新 生 代 GC 
时 将 记录 集 看 成 根 ( 像 根 一 样 的 东西 )， 并 进行 搜索 ， 以 发 现 指向 新 生 代 空间 的 指针 。 

不 过 如 果 我 们 为 此 记录 了 引用 的 目标 对 象 ( 即 新 生 代 对 象 )， 那 么 在 对 这 个 对 象 进行 晋升 ( 老 
年 化 ) 操 作 时 ， 就 没 法 改写 所 引用 对 象 ( 即 老年 代 对 象 ) 的 指针 了 。 举 个 例子 ， 请 看 图 7.4。 










































































新 生 代 空 间 老年 代 空 间 
db 复制 对 象 A 








新 生 代 空 间 老年 代 空 间 


图 7.4 记录 了 引用 的 目标 对 象 的 记录 集 











通过 查找 记录 集 ， 可 知 对 象 A 是 新 生 代 GC 的 对 象 。 执 行 新 生 代 GC 后 ，A 晋升 成 A 
不 过 这 个 状态 下 我 们 无 法 把 B 的 指针 的 引用 目标 由 A 改写 为 A'。 这 是 因为 在 图 7.4 中 ， 记 录 
集 里 没有 存储 “老年 代 对 象 B 引用 了 新 生 代 对 象 A” 这 一 信息 。 
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因此 ， 在 记录 集 里 不 会 记录 引用 的 目标 对 象 ， 而 是 记录 发 出 引用 的 对 象 。 这 样 一 来 ,我 
们 就 能 通过 记录 集 搜 索 发 出 引用 的 对 象 ， 进 而 晋升 引用 的 目标 对 象 ， 再 将 发 出 引用 的 对 象 的 
指针 更 新 到 目标 空间 了 。 




















记录 集 
国 困 | 
A 
新 生 代 空 间 老年 代 空 间 

















SN 复制 对 象 A 


可 以 更 新 指针 


硬 国 国 
A'/ 
i 老年 代 空间 











图 7.5 记录 了 发 出 引用 的 对 象 的 记录 集 








记录 集 基 本 上 是 用 固定 大 小 的 数组 来 实现 的 。 各 个 元 素 是 指向 对 象 的 指针 。 
那么 ,我 们 该 怎么 往 记录 集 里 记录 对 象 呢 ? 这 就 需要 下 一 节 中 为 大 家 介绍 的 “ 写 和 人 屏 
障 " 了。 


7.2.3 ” 写 入 屏障 


在 分 代 垃 圾 回收 中 ， 为 了 将 老年 代 对 象 记录 到 记录 集 里 ， 我 们 利用 写 人 屏障 (write barrier)。 
在 mutator 更 新 对 象 间 的 指针 的 操作 中 ， 写 人 屏障 是 不 可 或 缺 的 。write_barrier() 函数 的 
伪 代 码 如 代码 清单 7.1 所 示 。 这 个 函数 跟 第 3 章 中 出 现 的 update_ptr() 函数 是 在 完全 相同 
的 情况 下 被 调用 的 。 
代码 清单 7.1: write_barrier() 函数 


1 | write_barrier(obj，field，new_obj)T{ 
2 if(obj >= $old_start && new_obj < $old_start && obj.remembered == FALSE) 











3 $rs [$rs_index] = obj 


4 $rs_index++ 
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obj .remembered = TRUE 


5 
6 
7 *field = new_obj 
8 | 了 








参数 obj 是 发 出 引用 的 对 象 ，obj 内 存在 要 更 新 的 指针 ， 而 field 指 的 就 是 obj 内 的 域 ， 
new_obj 是 在 指针 更 新 后 成 为 引用 目标 的 对 象 。 
在 第 2 行 中 检查 以 下 3 点 。 





。 发 出 引用 的 对 象 是 不 是 老年 代 对 象 
。 指 针 更 新 后 的 引用 的 目标 对 象 是 不 是 新 生 代 对 象 
。 发 出 引用 的 对 象 是 否 还 没有 被 记录 到 记录 集中 





当 这 些 检查 结果 都 为 真 时 ，obj 就 被 记录 到 记录 集中 了 。 
第 3 行 的 $rs_index 是 用 于 新 记录 对 象 的 索引 。 
第 7 行 则 用 于 更 新 指针 。 


7.2.4 “对 象 的 结构 
在 Ungar 的 分 代 垃 圾 回收 中 ， 对 象 的 头 部 中 除了 包含 对 象 的 种 类 和 大 小 之 外 ， 还 有 以 下 


这 3 条 信息 。 





。 对 象 的 年 龄 (age ) 
。 已 经 复制 完毕 的 标志 (forwarded ) 
。 已 经 向 记录 集 记录 完毕 的 标志 ( remembered ) 





age 表示 的 是 对 象 从 新 生 代 GC 中 存活 下 来 的 次 数 ， 这 个 值 如 果 超 过 一 定 次 数 (AGE_ 
MAX)， 对 象 就 会 被 当成 老年 代 对 象 处 理 。 我 们 在 GC 复制 算法 和 GC 标记 - 压缩 算法 中 也 用 
到 过 forwarded， 这 里 它 的 作用 是 一 样 的 ， 都 是 用 来 防止 重复 复制 相同 对 象 的 标志 。 这 里 的 
remembered 也 一 样 ， 是 用 来 防止 向 记录 集中 重复 记录 的 标志 。 不 过 remembered 只 用 于 老年 
代 对 象 ，age 和 forwarded 只 用 于 新 生 代 对 象 。 

此 外 , 跟 GC 复制 算法 一 样 ， 在 这 里 我 们 也 使 用 forwarding 指针 。 在 forwarding 指针 中 
利用 obj.field1， 用 obj.forwarding 访问 obj.fieldl。 想 必 大 家 已 经 看 出 来 了 ， 这 个 方 
法 跟 我 们 在 第 4 章 和 第 $ 章 中 介绍 过 的 方法 一 样 。 

Ungar 的 分 代 垃 圾 回收 中 用 到 的 对 象 的 结构 如 图 7.6 所 示 。 
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age 
Temembered 
forwarded 










头 域 
图 7.6 对象 的 结构 
7.2.5 ”分配 
分 配 是 在 生成 空间 进行 的 。 执 行 分 配 的 new_obj() 函数 如 代码 清单 7.2 所 示 。 


代码 清单 7.2: new_obj() 函数 

















1 | new_obj(size){ 

2 if($new_free + Size >= $survivori_start) 
3 minor_gc() 

4 if($new_free + Size >= $survivori_start) 
5 allocation_fail() 

6 

7 obj = $new_free 

8 $new_free += size 

9 obj.age = 0 
10 obj.forwarded = FALSE 
下 obj .remembered = FALSE 
12 obj.size = size 
13 return obj 
14 | 了 








这 里 的 分 配 和 GC 复制 算法 中 的 分 配 基 本 一 样 。 不 过 这 里 的 $new_free 是 指向 生成 空间 
的 分 块 开 头 的 指针 。 

首先 在 第 2 行 检查 生成 空间 中 是 否 存 在 size 大 小 的 分 块 。 如 果 没 有 足够 大 小 的 分 块 ， 
就 执行 新 生 代 GC。 因 为 在 执行 新 生 代 GC 后 ， 就 可 以 利用 全 部 的 生成 空间 ， 所 以 只 要 对 象 
的 大 小 不 大 于 生成 空间 的 大 小 ， 就 肯定 能 被 分 配 到 生成 空间 。 

另 一 方面 ， 那 些 大 于 生成 空间 的 对 象 在 此 则 会 分 配 失 败 。 不 过 即使 不 能 被 分 配 到 生成 空 
间 ， 它 们 也 有 希望 被 分 配 到 更 大 的 老年 代 空间 。 因 此 ， 将 这 些 对 象 分 配 到 比 生 成 空间 更 大 的 
老年 代 空间 也 不 失 为 一 个 可 行 的 方法 。 

第 7 行 和 第 8 行 的 作用 和 GC 复制 算法 中 的 new_obj() 函数 一 样 ， 都 是 将 $new_free 滑 
动 size 大 小 。 
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7 





而 在 第 9 行 到 第 12 行进 行 的 是 对 象 的 初始 化 操作 。 


.2.6 ”新 生 代 GC 
生成 空间 被 对 象 占 满 后 ， 新 生 代 GC 就 会 启动 ， 执 行 这 项 操作 的 是 minor_gc() 函数 。 




















minor_gc() 函数 负责 把 新 生 代 空 间 中 的 活动 对 象 复制 到 To 幸存 空间 和 老年 代 空 间 。 我 们 先 


来 讲 


解 一 下 在 minor_gc() 函数 中 执行 复制 操作 的 copy() 函数 。 


代码 清单 7.3: copy() 函数 


2 


copy (obj)t{ 
if (obj.forwarded == FALSE) 

if(obj.age < AGE_MAX) 
copy_data($to_survivor_free, obj, obj.size) 
obj.forwarded = TRUE 
obj.forwarding = $to_survivor_free 
$to_survivor_free .age++ 
$to_survivor_free += obj.size 
for(child : children(obj)) 

*child = copy(*child) 
else 


promote (obj) 


return obj.forwarding 


} 





代码 清单 7.3 的 前 半 部 分 跟 我 们 在 第 4 章 中 提 到 的 copy() 函数 比较 像 。 首 先 在 第 2 行 调 查 





obj 是 否 已 复制 完毕 ， 如 果 尚 未 复制 完毕 ， 则 在 第 3 行 调 查 对 象 的 年 龄 。 如 果 obj .age < AGE_ 


MAX 





为 真 ， 也 就 是 说 如 果 复 制 对 象 还 年 轻 ， 那 么 就 在 第 4 行 到 第 8 行将 幸存 空间 作为 目标 空间 





进行 复制 ， 然 后 在 第 9 行 和 第 10 行 搜索 已 经 在 第 4 行 复制 的 对 象 ， 并 复制 其 子 对 象 。 


代码 


2 


OW Nb 











另 一 方面 ， 当 obj 的 年 龄 达到 AGE_MAX 时 ， 则 通过 promote() 函数 进行 晋升 操作 。 
最 后 返回 复制 目标 对 象 ， 即 obj .forwarding， 这 样 copy() 函数 就 结束 了 。 
那么 我 们 接着 往 下 讲 ， 执 行 晋 升 操作 的 promote() 函数 如 代码 清单 7.4 所 示 。 

















清单 7.4: promote() 函数 
promote(obj){ 
new_obj = allocate_in_old(obj) 
if (new_obj == NULL) 
major_gc() 
new_obj = allocate_in_old(obj) 
if (new_obj == NULL) 


allocation_fail() 
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8 

9 obj .forwarding = new_obj 

10 obj .forwarded = TRUE 

1 

12 for(child : children(new_obj)) 
13 if(*child < $old_start) 

14 $rs[$rs_index] = new_obj 
15 $rs_index++ 

16 new_obj .emembered = TRUE 
17 return 

18 | } 


























晋升 可 以 看 成 是 一 项 把 对 象 分 配 到 老年 代 空间 的 操作 ， 不 过 在 这 里 被 分 配 的 对 象 是 “新 
生 代 空 间 中 年 龄 达到 了 AGE_MAX 的 对 象 ”。 在 promote () 函数 中 ， 参 数 obj 是 需要 晋升 的 对 象 。 

首先 在 第 2 行 和 第 3 行 调查 能 和 否 把 obj 安排 到 老年 代 空间 里 去 。 如 果 不 能 ， 那 么 就 启动 
老年 代 GC 来 分 配 老 年 代 空 间 的 分 块 。 如 果 无 法 保留 分 块 ， 那 么 分 配 会 就 此 失败 。 因 为 我 们 
在 老年 代 GC 中 利用 了 GC 标记 -清除 算法 ， 所 以 第 2 行 到 第 7 行 和 GC 标记 - 清除 算法 的 
分 配 结构 基本 相同 。 

如 果 obj 能 安排 到 老年 代 空 间 里 ,那么 就 在 第 9 行 和 第 10 行 设置 forwarding 指针 以 及 
forwarded 标志 ， 然 后 在 第 13 行 调查 obj 是 否 有 指向 新 生 代 对 象 的 指针 。 如 果 obj 有 这 样 
的 指针 ， 就 在 第 14 行 和 第 15 行将 new_obj 记录 到 记录 集 里 。 向 记录 集中 记录 的 操作 只 会 
执行 一 次 。 

利用 copy() 函数 执行 新 生 代 GC 的 minor_gc() 函数 如 代码 清单 7.5 所 示 。 


代码 清单 7.5: 新 生 代 GC 












































1 | minor_gc(){ 

2 $to_survivor_free = $to_survivor_start 
3 for(r : $roots) 

4 if(*r < $old_start) 

5 *r = COpYy(*r) 

6 

7 i=0 

8 while(i < $rs_index) 

9 has_new_obj = FALSE 
10 for(child : children($rs[i])) 
44 if(*child < $old_start) 
12 *child = copy(*child) 
13 if(*child < $old_start) 
14 has_new_obj = TRUE 
15 if(has_new_obj == FALSE) 
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46. 
二 7 
18 
19 
20 
21 
22 
23 


$rs[i] .remembered = FALSE 
$rs_index-— 
swap($rs[i], $rs[$rs_index]) 
else 
i++ 
swap($from_survivor_start, $to_survivor_start) 
了 




















虽然 有 些 长 ， 不 过 并 不 是 很 难 。 

首先 在 第 2 行 分 配 To 幸存 空间 的 分 块 。 

然后 ， 在 第 3 行 到 第 5 行 复制 能 从 根 找到 的 新 生 代 对 象 。 

接着 ， 在 第 7 行 到 第 20 行 搜索 记录 集中 记录 的 对 象 $rs[i] ， 执 行 子 对 象 的 复制 操作 。 























这 是 为 了 复制 从 老年 代 对 象 引用 的 新 生 代 对 象 而 执行 的 操作 。 





























第 13 行 则 是 检查 复制 后 的 对 象 是 还 在 新 生 代 空间 ， 还 是 已 经 晋升 到 老年 代 空间 里 去 了 。 复 





制 后 的 对 象 如 果 还 在 新 生 代 空间 ， 就 要 把 已 经 设 定 为 FALSE 的 has_new_obj 标志 设 定 为 TRUE。 





在 程序 执行 到 第 15 行 时 ， 如 果 标 志 为 FALSE， 则 老年 代 对 象 $rs [i] 就 已 经 没有 指向 新 


生 代 空间 的 引用 了 。 这 种 情况 下 ， 我 们 在 第 16 行 到 第 18 行将 这 个 元 素 从 记录 集 里 删除 。 


最 后 在 第 22 行将 From 幸存 空间 和 To 幸存 空间 互 换 ， 新 生 代 GC 就 结束 了 。 
新 生 代 GC 的 执行 过 程 如 图 7.7 所 示 。 



































图 7.7 新 生 代 GC 


幸存 空间 满 了 怎么 办 ? 

通常 的 GC 复制 算法 把 空间 二 等 分 为 From 空间 和 To 空间 ， 即 使 From 空间 里 的 对 象 都 还 
活着 ， 也 确保 能 把 它们 收纳 到 To 空间 里 去 。 不 过 在 Ungar 的 分 代 垃 圾 回收 里 ，To 幸存 空间 必 
须 收纳 From 幸存 空间 以 及 生成 空间 中 的 活动 对 象 。From 幸存 空间 和 生存 空间 的 点 大 小 比 To 幸 
存 空间 大 ， 所 以 如 果 活 动 对 象 很 多 ，To 幸存 空间 就 无 法 容纳 下 它们 。 

当 发 生 这 种 情况 时 ， 稳 妥 起 见 只 能 把 老年 代 空 间作 为 复制 的 目标 空间 。 当 然 ， 如 果 频 繁 发 生 
这 种 情况 ， 分 代 过 圾 回收 的 优点 就 会 淡化 。 

然而 实际 上 经 历 晋 升 的 对 象 很 少 ， 所 以 这 不 会 有 什么 重大 问题 ， 因 此 在 伪 代 码 中 我 们 就 把 这 
步 操 作 省 略 掉 了 。 





































































































7.2.7 ”老年 代 GC 


关于 老年 代 GC， 这 里 没什么 特别 要 写 的 ， 用 我 们 之 前 介绍 的 基本 算法 运行 GC 就 行 了 。 

不 过 老年 代 GC 的 对 象 一 一 老年 代 空 间 比 整体 堆 要 小 ， 如 果 我 们 在 老年 代 GC 里 使 用 
GC 复制 算法 ,能 利用 的 空间 会 变 得 更 小 ， 所 以 这 不 太 现 实 。 

Ungar 的 论文 里 在 老年 代 GC 中 用 到 了 GC 标记 - 清除 算法 。 
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吞吐 量 得 到 改善 

“很 多 对 象 年 纪 轻 轻 就 会 死 ” 这 一 法 则 虽然 是 经 验 之 谈 ， 不 过 还 是 适用 于 大 多 数 情况 的 。 
以 这 个 法 则 为 前 提 ， 新 生 代 GC 只 将 刚 生成 的 对 象 当 成 对 象 ， 这 样 一 来 就 能 减少 时 间 上 的 消耗 。 

有 反 过 来 ,因为 老年 代 GC 是 针对 很 难 变 成 垃圾 的 老年 代 对 象 执行 的 ， 所 以 要 比 新 生 代 
GC 花 的 时 间 长 。 不过， 在 经 过 新 生 代 GC 而 晋升 的 对 象 把 老年 代 空 间 填 满 之 前 ， 老 年 代 GC 
都 不 会 被 执行 。 因 此 ， 老 年 代 GC 的 执行 频率 要 比 新 生 代 GC 低 。 

综合 来 看 ， 通 过 使 用 分 代 垃 圾 回收 ， 可 以 改善 GC 所 花费 的 时 间 (吞吐 量 )。 正 如 Ungar 
所 说 的 那样 :“ 据 实验 表明 ， 分 代 垃 圾 回收 花费 的 时 间 是 GC 复制 算法 的 /4。” 可 见 分 代 垃 圾 
回收 的 导入 非常 明显 地 改善 了 吞吐 量 。 

另 一 方面 ， 因 为 老年 代 GC 很 费时 间 ， 所 以 我 们 没 法 缩短 mutator 的 最 大 暂停 时 间 。 关 
于 使 用 分 代 垃圾 回收 来 缩减 mutator 最 大 暂停 时 间 的 方法 ， 我 们 将 在 7.7 节 为 大 家 介绍 。 
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在 部 分 程序 中 会 起 到 反作用 


“很 多 对 象 年 纪 轻 轻 就 会 死 ” 这 个 法 则 毕竟 只 适合 大 多 数 情况 ， 并 不 适用 于 所 有 程序 。 当 然 ， 
对 象 会 活 得 很 人 的 程序 也 有 很 多 。 对 这 样 的 程 序 执 行 分 代 垃圾 回收 ， 就 会 产生 以 下 两 个 问题 。 





。 新 生 代 GC 所 花费 的 时 间 增 多 
。 老 年 代 GC 频繁 运 行 


考虑 到 这 两 点 ， 翁 怕 我 们 没 法 利用 到 分 代 垃 圾 回收 的 优点 ， 或 者 就 算 利用 到 了 ， 效 果 也 
甚 微 。 

而 且 ， 写 入 屏障 导致 的 额外 负担 降低 了 乔 吐 量 。 只 有 当 新 生 代 GC 带 来 的 速度 提升 效果 
大 于 写 人 屏障 对 速度 造成 的 影响 时 ， 分 代 垃 圾 回收 才能 够 更 好 地 发 挥 作用 。 当 这 个 大 小 关系 
不 成 立时 ， 分 代 垃 圾 回收 就 没有 什么 作用 ， 或 者 说 反而 可 能 会 起 到 反作用 。 这 种 情况 下 我 们 
还 是 使 用 基本 算法 更 好 。 


[和 类 记录 各 代 之 间 的 引用 的 方法 


Ungar 的 分 代 垃 圾 回收 是 使 用 记录 集 来 记录 各 代 间 的 引用 的 。 采 用 这 个 方法 的 情况 下 ， 
为 了 直接 记录 发 出 引用 的 对 象 ， 对 应 每 个 发 出 引用 的 对 象 各 花费 了 1 个 字 。 这 样 一 来 内 存 空 
间 的 使 用 效率 就 不 怎么 样 了 。 

此 外 ， 如 果 各 代 之 间 的 引用 很 多 ， 还 会 出 现 记录 集 溢出 的 问题 。 

在 这 里 我 们 为 大 家 介 ee 


7.5.1 ”卡片 标记 


Paul R. Wilson 和 Thomas G. Moher 开发 了 一 种 叫 作 卡片 标记 (card marking ) 的 方法 P9。 

在 这 个 方法 中 ， 首 先 把 老年 代 空 间 按照 相等 的 大 小 分 割 开 来 ,分割 出 来 的 一 个 个 空间 就 
称 为 卡片 。 论 文中 提 到 ， 卡 片 的 合适 大 小 为 128 字 节 。 另 外 ， 我 们 还 要 为 每 个 卡片 准备 一 个 
与 其 对 应 的 标志 位 ， 并 将 这 个 位 作为 标记 表格 (mark table ) 进行 管理 。 请 大 家 回忆 一 下 我 们 
在 第 2 章 中 介绍 的 位 图 标记 的 内 容 。 

当 因 为 改写 指针 而 产生 从 老年 代 对 象 到 新 生 代 对 象 的 引用 时 ， 要 事先 对 被 改写 的 域 所 属 
的 卡片 设置 标志 位 ， 这 项 操作 可 以 通过 写 入 屏障 来 实现 。 即 使 对 象 跨 两 张 卡片 ， 也 不 会 有 什 
么 问题 。 
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标记 表格 


Vv | 








新 生 代 空 间 老年 代 空间 





图 7.8 卡片 标记 


GC 时 会 寻找 位 图 表格 。 当 找到 设置 了 标志 位 的 卡片 时 ， 就 会 从 卡片 开头 开始 寻找 指向 
新 生 代 空 间 的 引用 。 这 就 是 卡片 标记 。 

卡片 标记 的 一 大 特征 就 是 能 有 效 利用 内 存 空间 。 因 为 每 个 128 字 节 (1024 位 ) 的 新 生 代 
空间 都 只 需要 一 个 位 来 用 作 标 记 ， 所 以 整个 位 表 (bit table ) 只 需要 老年 代 空间 的 1/1024 的 空间 。 
也 就 是 说 ， 我 们 只 要 多 准备 出 老年 代 空 间 的 0.1% 大 小 的 内 存 空间 就 够 了 。 

此 外 ， 无 论 从 老年 代 空间 指向 新 生 代 空 间 的 引用 怎么 增加 ， 都 不 会 发 生 像 记录 集 那 样 溢 
出 的 情况 。 

另 一 方面 ， 这 个 方法 还 有 个 缺点 ， 比 如 如 果 在 标记 表格 里 设置 了 很 多 位 ， 那 么 可 能 就 会 
在 搜索 卡片 上 花费 大 量 时 间 。 因 此 只 有 在 局 部 存在 从 老年 代 空间 指向 新 生 代 空 间 的 引用 时 ， 
卡片 标记 才能 发 挥 作 用 。 


7.5.2 “页面 标记 


许多 0S 是 以 页 面 为 单位 来 管理 内 存 空间 的 ， 因 此 如 果 在 卡片 标记 中 将 卡片 和 页 面 设置 
为 同样 大 小 ， 我 们 就 能 得 到 0S 的 帮助 。 

一 旦 mutator 对 堆 内 的 某 一 个 页 面 进行 写 入 操作 ，05S 就 会 设置 跟 这 个 页 面 对 应 的 位 ， 我 
们 把 这 个 位 叫 作 页 面 重 写 标志 位 (dirty bit )。 

卡片 标记 中 是 搜索 标记 表格 ， 而 页 面 标记 (page marking) 中 则 是 搜索 这 个 页 面 重 写 标 志 位 。 



















































































新 生 代 空间 老年 代 空 间 


7.9 页面 标记 


156 第 7 章 分 代 垃 圾 回收 

















然而 ， 并 不 是 所 有 0S 都 具备 这 种 结构 。 我 们 为 不 能 利用 页 面 重 写 标志 位 的 0S 准备 了 
一 种 方法 ， 即 利用 内 存 保 护 功 能 。 

具体 来 说 ， 就 是 在 mutator 执行 过 程 中 保护 老年 代 空间 不 被 写 信 ， 当 mutator 写 人 老年 代 
空间 时 ， 通 过 异常 处 理 来 检测 出 这 项 操作 。 在 异常 处 理 函 数 的 内 部 ， 和 卡片 标记 一 样 ， 事 先 
设置 与 发 生 写 和 人 的 页 面 对 应 的 位 。 

根据 CPU 的 不 同 ， 页 面 大 小 也 不 同 ， 不 过 我 们 一 般 采 用 的 大 小 为 4K 字 节 。 

这 个 方法 只 适用 于 能 利用 页 面 重 写 标 志 位 或 能 利用 内 存 保 护 功 能 的 环境 。 另 外 ， 因 为 我 
们 检测 出 了 所 有 对 页 面 进行 的 写 入 操作 ， 所 以 除了 在 生成 了 从 老年 代 空 间 指 问 新 生 代 空间 的 
引用 时 ， 在 其 他 情况 下 也 需要 搜索 页 面 。 图 7.9 的 第 2 个 页 面 就 是 一 个 例子 。 





















































所 有 多 代 垃 圾 回收 


分 代 垃 圾 回收 将 对 象 分 为 新 生 代 和 老年 代 ， 通 过 尽量 减少 从 新 生 代 普 升 到 老年 代 的 对 象 ， 
来 减少 在 老年 代 对 象 上 消耗 的 垃圾 回收 的 时 间 。 

基于 这 个 理论 ， 大 家 可 能 会 想到 分 为 3 代 或 4 代 岂 不 更 好 ? 这 样 一 来 能 晋升 到 最 老 一 代 
的 对 象 不 就 更 少 了 吗 ?” 这 种 方法 就 叫 作 多 代 垃 圾 回收 (Multi-generational GC )。 

































































第 一 代 空间 第 二 代 空 间 第 三 代 空 间 第 四 代 空 间 














7.10 分 为 4 代 的 分 代 垃 圾 回收 





在 这 个 方法 中 ， 除 了 最 老 的 那 一 代 之 外 ， 每 代 都 有 一 个 记录 集 。X 代 的 记录 集 只 记录 来 
自 比 X 老 的 其 他 代 的 引用 。 

分 代数 量 越 多 ， 对 象 变 成 垃圾 的 机 会 也 就 越 大 ， 所 以 这 个 方法 确实 能 减少 活 到 最 老 代 的 
对 象 。 

但 是 我 们 也 不 能 过 度 增 加 分 代数 量 。 分 代数 量 越 多 ， 每 代 的 空间 也 就 相应 地 变 小 了 ， 这 
样 一 来 各 代 之 间 的 引用 就 变 多 了 ， 各 代 中 垃圾 回收 花费 的 时 间 也 就 越 来 越 长 了 。 























7.7 列车 垃圾 回收 157 

















综合 来 看 ， 少 设置 一 些 分 代 能 得 到 更 优秀 的 吞吐 量 ， 据 说 分 为 2 代 或 者 3 代 是 最 好 的 1 


yi 列车 垃圾 回收 


列车 垃圾 回收 (Train GC ) 是 由 Richard L. Hudson 和 J. Eliot B. Moss 发 明 的 方法 请 1。 它 是 
为 了 在 分 代 垃圾 回收 中 利用 老年 代 CC 而 采用 的 算法 ， 可 以 控制 老年 代 CC 中 暂停 时 间 的 增长。 
比 起 本 章 中 之 前 出 现 的 算法 ， 大 家 可 能 会 感觉 这 个 算法 有 些 难 以 理解 。 


7.7.1_ 堆 的 结构 


列车 垃圾 回收 中 将 老年 代 空 间 按照 一 定 大 小 划分 ， 每 个 划分 出 来 的 空间 称 为 车 厢 , 由 1 
个 以 上 的 车 厢 连 接 成 的 东西 就 叫 作 列 车 。 这 就 是 列车 垃圾 回收 名 字 的 由 来 。1 次 老年 代 GC 
是 以 1 个 车 厢 作 为 GC 对 象 的 。 

每 个 列车 和 每 个 车 厢 都 按 其 产生 的 顺序 被 荆 予 了 编号 ， 互 相连 接 。 和 车厢 就 是 以 这 个 顺序 
作为 GC 对 象 的 。 

此 外 ,我 们 要 为 各 列车 和 各 车 厢 准 备 记 录 集 。 列 车 的 记录 集 里 记录 的 是 来 自 其 他 列车 的 
引用 ， 和 车厢 的 记录 集中 记录 的 则 是 来 自 同一 列车 的 其 他 车 厢 的 引用 。 

列车 垃圾 回收 中 堆 的 结构 如 图 7.11 所 示 。 































































































新 生 代 空间 的 | 列车 1 的 车 厢 1-1 的 
记录 集 记录 和 集 记录 和 集 
[CLT] 
列车 1 
CL] 
列车 2 
CLIT] 
车 厢 3-2 
列车 3 
新 生 代 空 间 老年 代 空间 








图 7.11 堆 的 结构 
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当 通 过 新 生 代 GC 将 对 象 从 新 生 代 空间 晋升 时 ， 我 们 要 准备 已 有 的 车 厢 或 者 空 的 车 厢 ， 
将 对 象 安排 在 分 块 里 。 各 和 车厢 里 的 分 块 是 单独 作为 一 个 连续 的 内 存 空间 存在 的 。 也 就 是 说 ， 
我 们 在 这 里 执行 GC 时 ， 也 利用 了 GC 复制 算法 的 原理 。 

在 新 生 代 GC 结束 后 ， 就 该 执行 老年 代 GC 了 。 在 执行 老年 代 GC 时 ， 开 头 列车 的 开头 
车 厢 是 GC 的 对 象 。 在 老年 代 GC 执行 后 ， 因 为 那些 作为 GC 对 象 的 车 厢 里 只 剩 下 了 垃圾 ， 
所 以 我 们 将 这 些 车 厢 作 为 空 车 厢 保 留 ， 以 便 执 行 下 一 次 新 生 代 GC。 

此 外 ， 列 车 垃圾 回收 里 的 对 象 结构 和 在 Ungar 的 分 代 垃 圾 回收 里 用 到 的 对 象 结构 完全 一 致 。 


7.7.2 “新 生 代 GC 


当 新 生 代 空 间 满 了 的 时 候 ， 新 生 代 GC 就 开始 运行 了 。 新 生 代 GC 会 把 根 或 者 老年 代 对 象 
引用 的 新 生 代 对 象 复制 到 老年 代 空 间 里 去 。 首 先 我 们 一 起 来 看 看 执行 复制 操作 的 copy() 函数 吧 。 


代码 清单 7.6: copy() 函数 






































1 | :copy(obj, to car){ 

2 if (obj.forwarded == FALSE) 

3 if(to_car.free + obj.size >= to_car.start + CAR_SIZE) 
4 to_car = new_car(to_car) 

5 copy_data(to_car.free, obj, obj.size) 
6 obj.forwarding = to_car.free 

7 obj.forwarded = TRUE 

8 to_car.free += obj.size 

9 for(child : children(obj.forwarding)) 
10 *child = copy(*child, to_car) 

11 

12 return obj.forwarding 

13 |} 





copy() 因数 将 对 象 obj 复制 到 目标 车 厢 to_car 的 分 块 里 。 关 于 to_car 我 们 会 在 下 面 
介绍 minor_gc() 函数 时 为 大 家 说 明 。 

首先 在 第 2 行 调查 obj 是 否 已 复制 完毕 。 如 果 疝 未 复制 完毕 ， 就 需要 确认 是 否 能 把 obj 
安排 到 to_car 的 分 块 里 。 如 果 分 块 太 小 ， 没 办 法 放下 obj 的 话 ， 就 通过 new_car() 函数 将 
to_car 连接 到 空 的 车 而 上 ， 以 此 形成 一 个 新 的 to_car。 

new_car() 函数 将 空 的 车 厢 连 接 到 被 赋予 参数 的 车 厢 car 的 后 面 ， 将 它 和 car 合并 为 同 
一 辆 列车 。 此 外 ， 当 new_car() 函数 的 参数 为 NULL 时 ， 就 在 老年 代 空 间 里 的 车 厢 的 最 后 面 
接 上 一 节 空 的 车 厢 ， 创 造 出 一 辆 仅 由 一 节 车 厢 构 成 的 新 列车 。 

在 第 5 行 到 第 8 行 ， 复 制 obj， 并 设 定 forwarding 指针 等 。 

在 第 9 行 和 第 10 行 ， 搜 索 复 制 完 毕 的 对 象 ， 并 复制 子 对 象 ， 这 里 和 Ungar 的 分 代 垃 专 
回收 很 相似 。 
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那么 ， 我 们 是 怎么 决定 to_car 的 呢 ? 大 家 看 一 下 minor-_gc() 函数 就 会 明白 了 。minor- 
gc() 函数 的 伪 代 码 如 代码 清单 7.7 所 示 。 
代码 清单 7.7: minor_gc() 函数 


minor_gc(){ 


上 


to_car = new_car(NULL) 
for(r : $roots) 
if(*r < $old_start) 


*r = COpy(*r, to_car) 


for(remembered_obj : $young_rs) 
for(child : children(*remembered_obj)) 
if(*child < $old_start) 


to_car = get_last_car(obj_to_car(*remembered_obj)) 


‘OO OO 人 WD 


> 忆 
ee 


*child = copy(*child, to_car) 


上 
ID 





} 


首先 在 第 2 行 准 备 一 节 空 的 车 厢 ,， 将 它 作为 to_car。 然 后 在 第 3 行 到 第 5 行 复 制 新 生 
代 空 间 中 由 根 引 用 的 对 象 。 

再 然后 ,在 第 7 行 到 第 11 行 搜索 新 生 代 空间 的 记录 集 $young_rs， 复 制 新 生 代 空间 中 
那些 由 老年 代 空 间 引 用 的 对 象 。 这 时 的 to_car 和 我 们 在 第 3 行 到 第 $ 行 所 进行 的 复制 操作 
不 同 。 在 这 里 我 们 将 发 出 引用 的 对 象 *remembered_obj 所 属 列车 的 最 后 一 节 车 厢 设 为 to_ 
car。 不 过 ， 第 10 行 的 obj_to_car() 函数 会 返回 参数 obj 所 属 的 车 厢 ，get_last_car() 则 
会 返回 参数 car 所 属 列车 的 最 后 一 节 车 厢 。 

根据 第 7 行 到 第 11 行 的 操作 ， 有 具有 引用 关系 的 对 象 被 安排 到 了 同一 辆 列车 里 。 这 在 列 
车 垃圾 回收 中 有 着 重要 的 意义 。 详 情 我 们 会 在 7.7.6 节 中 进行 说 明 。 

在 列车 垃圾 回收 里 ， 新 生 代 GC 的 情况 如 图 7.12 所 示 。 

















159 


160 第 7 章 分 代 垃 圾 回收 














新 生 代 空间 老年 代 空间 














7.12 列车 垃圾 回收 里 的 新 生 代 GC 


7.7.3 ”老年 代 GC 





在 执行 完 新 生 代 GC 之 后 ， 我 们 继续 执行 老年 代 GC。 
老年 代 GC 是 以 开头 列车 的 开头 车 厢 作 为 GC 对 象 的 。 在 这 里 我 们 将 作为 GC 对 象 的 车 





























厢 设 为 $from_car。 在 每 次 执行 老年 代 GC 时 ， 通 过 将 $from_car 里 的 活动 对 象 复制 到 其 他 
车 厢 ， 来 回收 空 了 的 $from_car。 


列车 垃圾 回收 里 的 major_gc() 函数 如 代码 清单 7.8 所 示 。 


代码 清单 7.8: major_gc() 函数 


‘OO OO 


FF FF 
WP 靖 口 


major_gc (Ot 

has_root_reference = FALSE 

to_car = new_car (NULL) 

Or(r roots) 

if(is_in_from train(*r) == TRUE) 
has_root_reference = TRUE 
if(is_in_from_ car(*r)) 
*r = Copy(*r, to_car) 


if(has_root_reference == FALSE kg is_empty(train_rs($from car)) == TRUE) 
reclaim train($from_car) 


return 
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14 scan_rs(train_rs($from car)) 
15 scan_rs(car_rs($from car)) 
16 add_to_freelist($from_car) 
17 $from_ car = $from car.next 
18 |} 





首先 在 第 2 行将 has_root_reference 这 个 变量 赋值 为 FALSE。 这 是 一 个 标志 ， 表 示 以 
$from_car 开头 的 列车 里 是 否 存在 从 根 的 引用 。 我 们 会 在 第 10 行 用 到 这 个 标志 。 

接 下 来 在 第 3 行 准备 一 节 空 的 车 厢 作 为 to_car。 

然后 ， 在 第 4 行 到 第 8 行将 $from_car 里 所 有 从 根 引 用 的 对 象 都 复制 到 to_car 里 去 。 

另外 ,我 们 还 要 在 第 5 行 调查 发 出 引用 的 对 象 fr 是 否 跟 $from_car 在 同一 辆 列车 上 。 
如 果 条 件 句 为 真 ， 就 把 has_root_reference 设 定 为 TRUE。 

第 10 行 的 if 语句 则 用 来 调查 “以 $from_car 开头 的 列车 是 否 没 有 来 自 于 根 的 引用 ， 且 
这 辆 列车 的 记录 集 是 否 为 空 ”。 当 没有 从 外 部 指向 这 辆 列车 的 引用 时 ， 也 就 是 说 ， 列 车 里 的 
对 象 都 是 被 同一 辆 列车 里 的 对 象 所 引用 时 ， 第 10 行 的 检查 结果 就 为 真 ， 此 时 就 可 以 将 整 辆 
列车 一 并 回收 。 执 行 这 项 回收 操作 的 就 是 第 11 行 的 reclaim_train() 函数 。 这 个 函数 将 以 
$from_car 开头 的 列车 一 并 连接 到 $free_list， 将 下 一 辆 列车 的 开头 车 厢 作 为 下 一 个 $from_ 
car。 将 列车 一 并 回收 时 的 情况 如 图 7.13 所 示 。 
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车 厢 2-1 


图 7.13 ”将 列车 一 并 回收 时 的 情况 
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在 第 14 行 和 第 15 行 ， 通 过 scan_rs() 国 数 分 别 搜索 $from_car 的 列车 的 记录 集 以 及 车 
厢 的 记录 集 ， 复 制 $from_car 里 的 对 象 。 下 面 就 让 我 们 来 看 一 下 scan_rs() 函数 吧 。 


代码 清单 7.9: scan_rs() 函数 


1 | scan_rs(rs){ 














2 for (remembered_obj : rs) 

3 for(child : *remembered_obj) 

4 if(is_in_from car(*child) == TRUE) 

5 to_car = get_last_car(obj_to_car(*remembered_o0bj)) 
6 

7 


*child = copy(*child, to_car) 





} 





第 4 行 用 来 调查 被 赋予 参数 的 记录 集 rs 的 元 素 remembered_obj 的 子 对 象 chila 是 否 在 
$from_car 内 。 

$from_car 内 的 对 象 会 被 复制 到 to_car。 此 时 的 to_car 是 发 出 引用 的 对 象 所 属 列车 最 
末尾 的 车 厢 。 如 果 to_car 装 不 下 这 些 对 象 ， 那么 我 们 就 新 连接 一 节 空 车 厢 。 搜 索 列 车 1 的 
记录 集 以 及 车 厢 1-1 的 记录 集 时 的 情况 分 别 如 图 7.14 和 图 7.15 所 示 。 











$from car $from car 


列车 























图 7.14 搜索 列车 1 的 记录 集 


$from car $from car 









列车 1 列车 1 

















图 7.15 ”搜索 车 春 1-1 的 记录 和 集 
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让 我 们 再 次 回 到 代码 清单 7.8。 在 第 17 行 回 收 $from_car， 在 第 18 行将 $from_car.next 作为 
下 一 个 $from_car。 
7.7.4。 写 入 屏障 
比 起 Ungar 的 分 代 垃 圾 回收 中 的 写 和 屏障， 列车 垃圾 回收 中 的 写 入 屏障 要 稍微 复杂 一 点 。 


代码 清单 7.10: write_barrier() 函数 


1 | write_barrier(obj，field，new_obj)T{ 





2 if(obj >= $old_start) 

3 if(new_obj < $0old_start) 

4 add(obj, $young_rs) 

5 else 

6 src_car = obj_to_car(obj) 

7 dest_car = obj_to_car(new_obj) 

8 if(src_car.train _ num > dest_car.train_num) 
9 add(obj, train_rs(dest_car)) 

10 else if(src_car.car_num > dest_car.car_num) 
并 add(obj, car_rs(dest_car)) 

12 

13 *field = new_obj 

14 | 


在 列车 垃圾 回收 中 ， 我们 把 发 出 引用 的 对 象 obj 记录 到 了 记录 集中 ， 但 需要 根据 情况 来 
灵活 使 用 这 个 记录 集 。 

首先 在 第 2 行 调查 obj 是 不 是 老年 代 对 象 。 如 果 obj 是 新 生 代 对 象 ， 就 没 必 要 把 它 记 录 
到 记录 集 里 了 。 

然后 在 第 3 行 调查 引用 的 目标 对 象 new_obj 是 不 是 新 生 代 对 象 。 如 果 是 ， 就 要 将 obj 记 
录 到 新 生 代 空 间 的 记录 集中 。 

如 果 new_obj 是 老年 代 对 象 ， 就 要 进一步 调查 obj 和 new_obj 所 属 的 列车 及 车 厢 ， 分 情况 
使 用 记录 集 记 录 obj。src_car、dest_car 是 两 个 车 厢 ， 前 者 是 指针 发 出 引用 的 对 象 所 属 的 车 
厢 ， 后 者 是 指针 引用 的 目标 对 象 所 属 的 车 厢 。 如 果 dest_car 所 属 的 列车 位 于 src_car 所 属 的 
列车 的 前 面 ， 那 么 我 们 就 将 发 出 引用 的 对 象 obj 记录 到 dest_car 所 属 列车 的 记录 集中 。 如 果 
dest_car 位 于 src_car 的 前 面 ， 那 么 我 们 就 把 发 出 引用 的 对 象 obj 记录 到 src_car 的 记录 集中 。 

最 后 更 新 指针 。 

关于 写 人 屏障 的 分 情况 讨论 ， 大 家 是 否 有 什么 不 理解 的 地 方 呢 ? 列车 垃圾 回收 只 在 记录 
集中 记录 了 从 后 面 车 厢 ( 列 车 ) 到 前 面 车 厢 ( 列 车 ) 的 引用 ， 没 有 记录 从 前 面 车 厢 到 后 面 车 厢 
的 引用 。 这 是 为 什么 呢 ? 

答案 就 在 老年 代 GC 时 和 车厢 的 选择 方法 里 。 列 车 垃圾 回收 将 开关 车厢 作为 GC 的 对 象 ， 
所 以 当 老 年 代 GC 开始 执行 时 ， 当 然 就 没有 比 作为 GC 对 象 的 车 厢 更 靠 前 的 车 厢 了 。 
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也 就 是 说 ， 在 执行 老年 代 GC 时 ， 只 要 考虑 来 自 于 根 以 及 比 作为 GC 对 象 的 车 厢 更 靠 后 
的 车 厢 的 引用 就 可 以 了 ， 因 此 需要 搜索 的 对 象 就 减少 了 。 

这 样 一 来 ， 用 写 入 屏障 往 记 录 集 里 记录 对 象 时 ， 通 过 调查 引用 的 目标 对 象 和 发 出 引用 的 
对 象 所 属 列车 和 车 厢 的 前 后 关系 ， 略 微 减 少 了 需要 记录 的 对 象 。 


@@ 
记录 集 的 溢出 

各 实 上 我 们 在 前 面 介 绍 write_barrier() 国 数 的 伪 代 码 时 留 了 一 个 陷阱 ， 那 就 是 没有 考虑 到 

记录 集 满 了 的 情况 。 

如 果 新 生 代 空间 的 记录 集 满 了 ， 就 必须 执行 新 生 代 GC 来 清空 新 生 代 空间 ， 要 不 然 就 没 法 继 
续 进 行 分 配 。 

另 一 方面 ， 在 老年 代 空 间 中 ， 如 果 某 个 车 厢 C 的 记录 集 满 了 应 该 怎么 办 呢 ? 此 时 车 厢 C 不 一 
定 是 老年 代 GC 的 对 象 车 厢 。 就 算 我 们 硬 要 对 车 厢 C 执行 GC ， 也 必须 考虑 C 前 面 的 列车 及 车 厢 
对 C 的 引用 。 此 外 ， 因 为 记录 集 已 满 ， 所 以 搜索 记录 集 所 需要 的 时 间 也 会 比 平常 所 需 时 间 长 。 
本 来 记录 集 满 了 就 意味 着 此 车 厢 里 挤 满 了 受 欢 迎 (也 就 是 被 引用 数 非常 大 ) 的 对 象 。 这 样 的 对 
象 很 难 成 为 垃圾 ， 每 次 执行 GC 都 需要 对 其 进行 复制 操作 。 

为 了 省 去 花费 在 这 项 复制 操作 上 的 时 间 ， 我 们 有 个 办 法 ， 那 就 是 索性 把 车 厢 C 排除 到 GC 对 
象 的 范围 之 外 去 。 这 看 上 去 像 是 白白 浪费 了 一 个 车 厢 ， 不 过 考虑 到 车 厢 C 中 大 多 数 对 象 都 会 在 执 
行 GC 后 存活 下 来 ， 所 以 一 开始 就 不 对 其 执行 GC 可 能 要 更 为 划算 些 。 

因为 这 种 处 理 不 是 算法 本 质 上 的 处 理 ， 所 以 本 书 中 就 不 再 详 述 了 。 
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7.7.5 ”优点 


以 Ungar 的 分 代 垃 圾 回收 为 代表 的 一 般 的 分 代 垃 圾 回收 都 因为 老年 代 GC 而 增加 了 
mutator 的 最 大 暂停 时 间 。 这 是 因为 分 代 垃 圾 回收 将 整个 老年 代 空间 这 个 比较 大 的 堆 当 成 了 
老年 代 GC 的 对 象 。 而 在 列车 垃圾 回收 中 ， 一 次 老年 代 GC 只 将 堆 中 非常 小 的 一 部 分 ( 即 车 厢 ) 
当成 GC 的 对 象 ， 因 此 就 能 缩减 各 老年 代 GC 所 造成 的 mutator 的 最 大 暂停 时 间 了 。 

此 外 ， 列 车 垃圾 回收 还 能 回收 循环 的 大 型 垃圾 ， 这 一 点 不 容 忽视 。 列 车 垃圾 回收 之 所 以 
能 回收 跨 多 个 块 (在 这 里 也 就 是 车 厢 ) 的 大 型 垃圾 ， 是 因为 列车 垃圾 回收 会 把 互相 引用 的 对 
象 安排 在 同一 辆 列车 上 。 请 大 家 回忆 一 下 在 老年 代 GC 中 是 如 何 选择 to_car 的 。 在 列车 垃 
圾 回收 中 ,我 们 采用 的 方针 是 将 要 复制 的 对 象 跟 发 出 引用 的 对 象 安排 在 同一 辆 列车 上 。 这 样 
一 来 ， 在 重复 执行 老年 代 GC 的 过 程 中 ， 所 有 构成 垃圾 的 对 象 群 早晚 会 被 安排 到 同一 辆 列车 上 ， 
因此 我 们 就 能 整个 回收 这 辆 列车 。 
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如 果 我 们 没有 考虑 到 这 点 会 怎么 样 呢 ? 打 个 比方 ,通过 使 用 在 第 4 章 中 提 到 的 多 空间 复制 
算法 ， 就 可 以 跟 列 车 垃圾 回收 一 样 ， 在 一 次 老年 代 GC 中 只 针对 老年 代 空 间 的 一 个 块 执行 GC 了 。 
在 此 我 们 来 考虑 一 下 图 7.16(a) 这 样 的 状况 。 
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图 7.16 ”通过 多 空间 复制 算法 执行 老年 代 GC 











对 象 群 A 到 C 形成 了 循环 垃圾 。 在 此 状态 下 ， 如 有 果 我 们 将 $heap[1] 作为 From 空间 ， 
将 $heap [0] 作为 To 空间 ， 以 此 来 执行 多 空间 复制 算法 ， 结 果 会 如 何 呢 ? 

虽然 A 本 来 是 垃圾 ,不 过 因为 它 被 其 他 块 引 用 了 ,所 以 会 被 当成 活动 对 象 而 复制 到 
heap[0] 去 。 同 样 ，B、C 也 会 被 按 顺 序 复制 过 去 。 

像 这 样 ， 在 循环 垃圾 对 象 群 跨 复数 个 块 时 ， 因 为 多 空间 复制 算法 只 能 将 已 经 成 为 垃圾 的 
对 象 群 进行 部 分 移动 ,所 以 再 怎么 重复 执行 GC， 也 没 法 回收 这 样 的 垃圾 。 


7.7.6 ”缺点 


在 列车 垃圾 回收 中 执行 写 和 人 屏障 所 产生 的 额外 负担 ， 要 比 在 Ungar 的 分 代 垃 圾 回收 中 执 
行 时 所 产生 的 更 大 ， 因 此 在 吞吐 量 方面 ， 列 车 垃圾 回收 要 比 Ungar 的 分 代 垃 圾 回收 差 一 些 。 

不 止 是 这 样 。 实 际 上 minor_gc() 困 数 和 major_gc() 函数 的 盆 代 码 也 有 个 很 大 的 陷阱 ， 
那 就 是 没有 考虑 到 比 车 厢 大 的 对 象 。 列 车 垃圾 回收 是 以 每 个 对 象 都 小 于 一 个 车 厢 为 前 提 的 。 

本 书 中 虽然 没有 提 及 ， 不 过 对 于 比 车 厢 大 的 对 象 ， 需 要 将 其 安排 到 新 生 代 空间 和 老年 代 
空间 以 外 的 堆 ， 使 用 跟 列 车 垃圾 回收 不 同 的 方法 来 执行 GC。 









































增 量 式 垃 圾 回收 





增 量 式 垃 圾 回收 (Incremental GC ) 是 一 种 通过 逐渐 推进 垃圾 回收 来 控制 mutator 最 
大 暂停 时 间 的 方法 。 


/wy 2doy Sday 


:天 几 什么 是 增 量 式 垃圾 回收 


通常 的 GC 处 理 很 繁重 , 一旦 GC 开始 执行 ， 不 过 多 久 mutator 就 没 法 执行 了 ， 这 是 常 有 
的 事 。 也 就 是 说 ，GC 本 来 是 从 事 幕 后 工作 的 ， 可 是 它 却 一 下 子 器 张 起 来 ， 害 得 mutator 这 个 
主角 都 没 法 发 挥 作用 了 。 我 们 将 像 这 样 的 在 执行 时 害 得 mutator 完全 停止 运行 的 GC 叫 作 停 
止 型 GC ,停止 型 GC 的 示意 图 如 图 8.1 所 示 。 
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8.1 停止 型 GC 的 示意 图 





GD 英语 为 Stop-The-World-GC， 即 “停止 世界 而 执行 的 GC”。 
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根据 应 用 程序 (mutator ) 的 用 途 不 同 ， 有 时 停止 型 GC 是 很 要 命 的 。 

因此 人 们 想 出 了 增 量 式 垃圾 回收 这 种 方法 。 增 量 (incremental) 这 个 词 有 “ 慢 慢 发 生变 化 ” 
的 意思 。 就 如 它 的 名 字 一 样 ， 增 量 式 垃圾 回收 是 将 GC 和 mutator 一 点 点 交替 运行 的 手法 。 
增 量 式 垃圾 回收 的 示意 图 如 图 8.2 所 示 。 
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图 8.2 ” 增 量 式 垃圾 回收 的 示意 图 
在 本 章 中 我 们 将 会 介绍 增 量 式 垃圾 回收 的 三 种 算法 。 


8.1.1 “三 色 标 记 算 法 


描述 增 量 式 垃 圾 回收 的 算法 时 我 们 有 个 方便 的 概念 ， 那 就 是 Edsger W. Dijkstra 等 人 提出 
0 a color marking)03。 顾 名 思 义 ， 这 个 算法 就 是 将 GC 中 的 对 象 按照 各 自 的 
情况 分 成 三 种 ， 这 三 种 颜色 和 所 包含 的 意思 分 别 如 下 所 示 。 

。 和 白色 : 还 未 搜索 过 的 对 象 


。 黑 色 : 搜索 完成 的 对 象 

















我 们 以 GC 标记 - 清除 算法 为 例 向 大 家 再 详细 地 说 明 一 下 。 

GC 开始 运行 前 所 有 的 对 象 都 是 白色 。GC 一 开始 运行 ， 所 有 从 根 能 到 达 的 对 象 都 会 被 标 
记 ， 然 后 被 堆 到 栈 里 。GC 只 是 发 现 了 这 样 的 对 象 ， 但 还 没有 搜索 完 它们 ， 所 以 这 些 对 象 就 
成 了 灰色 对 象 。 

灰色 对 象 会 被 依次 从 栈 中 取出 ， 其 子 对 象 也 会 被 涂 成 灰色 。 当 其 所 有 的 子 对 象 都 被 涂 成 
灰色 时 ， 对 象 就 会 被 涂 成 黑色 。 

当 GC 结束 时 已 经 不 存在 灰色 对 象 了 ， 活 动 对 象 全 部 为 黑色 ， 垃 圾 则 为 白色 。 

这 就 是 三 色 标记 算法 的 概念 。 有 一 点 需要 我 们 注意 ， 那 就 是 为 了 表现 黑色 对 象 和 灰色 对 
象 ， 不 一 定 要 在 对 象 头 里 设置 标志 ;( 事 实 上 也 有 通过 标志 来 表现 黑色 对 象 和 灰色 对 象 的 情况 
在 这 里 我 们 根据 对 象 的 情况 ， 更 抽象 地 把 对 象 用 三 个 颜色 表现 出 来 。 每 个 对 象 是 什么 样 的 状 
况 ， 意 味 着 什么 颜色 ， 这 些 都 根据 算法 的 不 同 而 不 同 。 

此 外 ， 虽 然 本 书 中 没有 为 大 家 详细 说 明 ,， 不 过 三 色 标 记 算 法 这 个 概念 不 仅 能 应 用 于 GC 
标记 - 清除 算法 ， 还 能 应 用 于 其 他 所 有 搜索 型 CC 算法 。 
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8.1.2 GC 标记 -清除 算法 的 分 割 








那么 ， 如 果 将 GC 标记 - 清除 算法 增 量 式 运行 会 如 何 呢 ? 
增 量 式 的 GC 标记 - 清除 算法 可 分 为 以 下 三 个 阶段 。 


。 根 查找 阶段 
。 标 记 阶 段 


。 清 除 阶段 


我 们 在 根 查 找 阶 段 把 能 直接 从 根 引用 的 对 象 涂 成 灰色 。 在 标记 阶段 查找 灰色 对 象 ， 将 其 


子 对 象 也 涂 成 灰色 ,查找 结束 后 将 灰色 对 象 涂 成 黑色 。 在 清除 阶段 则 查找 堆 ， 将 白色 对 象 连 
接 到 空闲 链表 ， 将 黑色 对 象 变 回 日 色 。 


那么 我 们 来 一 起 看 一 下 执行 增 量 式 垃 圾 回收 的 incremental_gc() 限 数 吧 。 


代码 清单 8.1: incremental_gc() 函数 


1 


2 
3 
4 
5 
6 
? 
8 
9 


incremental_gc(){ 

case $gc_phase 

when GC_ROOT_SCAN 
root_scan_phase() 

when GC_MARK 
incremental_mark_phase() 

else 
incremental_sweep_phase() 


} 





首先 在 第 2 行 检查 变量 $gc_phase， 判 断 应 该 进入 哪个 阶段 。 
当 $gc_phase 为 GC_R00T_SCAN 时 ， 进 入 根 查找 阶段 。 在 根 查找 阶段 中 ， 我 们 将 直接 从 





根 引用 的 对 象 打 上 标记 ， 堆 放 到 标记 栈 里 。 根 查找 阶段 只 在 GC 开始 时 运行 一 次 。 关 于 根 查 
找 的 详细 内 容 ， 我 们 将 在 8.1.3 节 进 行 说 明 。 


行 。 





当 根 查找 阶段 结束 后 ，incremental_gc() 函数 也 告 一 段落 ，mutator 会 再 次 开始 运 
接 下 来 再 次 执行 incremental_gc() 函数 时 会 进入 标记 阶段 。 在 标记 阶段 中 会 调用 到 


incremental_mark_phase() 函数 。 这 个 函数 会 从 标记 栈 中 取出 和 搜索 对 象 。 当 操作 进行 过 
一 定 次 数 后 ，mutator 会 再 次 开始 运行 。 然 后 周而复始 ， 直 到 标记 栈 为 空 时 ， 标 记 阶 段 就 结束 了 。 
之 后 的 GC 就 到 清除 阶段 了 。 详 情 请 参考 8.1.4 节 。 

















在 清除 阶段 也 会 进行 增 量 。incremental_sweep_phase() 图 数 不 是 一 次 性 清除 整个 堆 ， 





而 是 每 次 只 清除 一 定 个 数 ， 然 后 中 断 GCC， 再 次 运行 mutator。 详 情 请 参考 8.1.6 节 。 


增 量 


如 上 所 示 ， 我 们 将 GC 标记 - 清除 算法 进行 了 细 分 处 理 。 光 看 这 些 好 像 能 很 轻松 地 实现 
式 垃圾 回收 ， 事 实 上 并 没有 那么 简单 。 


8.1.3 ，” 根 查找 阶段 
根 查 找 阶 段 非 常 简单 。 作 为 根 查 找 实体 的 root_scan_phase() 函数 如 代码 清单 8.2 所 示 。 


代码 清单 8.2: root_scan_phase() 函数 


1 | root_scan_phase(){ 


2 for(r : $roots) 

3 mark(*r) 

4 $gc_phase = GC_MARK 
5 | 了 


在 第 2 行 和 第 3 行 ， 对 能 直接 从 根 找到 的 对 象 调用 mark() 函数 。mark() 函数 的 伪 代 码 
如 代码 清单 8.3 所 示 。 


代码 清单 8.3: mark() 函数 
1 | mark(obj)t{ 


2 if(obj.mark == FALSE) 

3 obj.mark = TRUE 

4 push(obj, $mark._stack) 
5 | 了 





如 果 参 数 obj 还 没有 被 标记 ， 那 么 就 将 其 标记 后 堆 到 标记 栈 。 这 个 函数 正 是 把 obj 由 白 
色 涂 成 灰色 的 函数 。 在 下 一 节 中 我 们 将 讲 到 标记 阶段 ， 那 里 面 也 出 现 了 mark() 函数 。 

当 我 们 把 所 有 直接 从 根 引 用 的 对 象 涂 成 了 灰色 时 ， 根 查找 阶段 就 结束 了 ，mutator 会 继 
续 执 行 。 

此 外 ， 这 时 $gc_phase 变 成 了 GC_MARK。 也 就 是 说 ,下 一 次 GC 时 会 进入 标记 阶段 。 


8.1.4 ”标记 阶段 
在 代码 清单 8.1 中 出 现 的 incremental_mark_phase() 印 数 如 代码 清单 8.4 所 示 。 

















代码 清单 8.4: incremental_mark_phase() 函数 
1 | incremental_mark_phase (){ 
for(i : 1..MARK_MAX) 
if(is_empty($mark_stack) == FALSE) 
obj = pop($mark_stack) 
for(child : children(obj)) 
mark(*child) 
else 


for(r 2 $roots) 


‘OO Oma 人 wD 


mark (*r) 
while(is_empty($mark_stack) == FALSE) 
obj = pop($mark_stack) 


上 
© 





上 
2 
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12 for(child : children(obj)) 
13 mark(*child) 

14 

15 $gc_phase = GC_SWEEP 

16 $sweeping = $heap_start 

17 return 

18 | } 





在 第 3 行 到 第 6 行 ， 从 标记 栈 取出 对 象 ， 将 其 子 对 象 涂 成 灰色 ,将 这 一 系列 操作 执行 
MARK_MAX 次 。 在 这 里 “MARK_MAX 次 ”是 重点 。 不 是 一 次 处 理 所 有 的 灰色 对 象 ， 而 是 只 处 理 一 
定 个 数 ， 然 后 暂停 CC， 再 次 开始 执行 mutator。 这 样 一 来 ， 就 能 缩短 mutator 的 最 大 暂停 时 间 。 

第 8 行 到 第 13 行 是 即将 结束 标记 阶段 时 进行 的 处 理 ， 在 这 里 重新 标记 能 从 根 引 用 的 对 象 。 
因为 GC 中 会 把 来 自 于 根 的 引用 更 新 ， 所 以 这 项 处 理 是 用 来 应 对 这 次 更 新 的 。 在 这 里 如 果 有 
很 多 没 被 标记 的 活动 对 象 ， 可 能 会 导致 mutator 的 暂停 时 间 延 长 。 第 15 行 和 第 16 行 则 是 为 
进入 清除 阶段 而 做 的 准备 工作 。 

我 们 再 来 详细 地 看 一 下 标记 阶段 。 如 果 把 标记 阶段 暂停 ， 那 么 再 次 执行 mutator 会 发 生 
什么 事 呢 ? 请 看 图 8.3。 
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图 8.3 活动 对 象 的 标记 遗漏 














图 8.3(a) 是 刚刚 暂停 标记 阶段 后 的 状态 ，A 被 涂 成 黑色 ，B 被 涂 成 灰色 。 所 以 接 下 来 就 
要 对 B 进行 搜索 了 。 在 这 里 我 们 继续 执行 mutator 吧 。 
图 8.3(b) 是 mutator 把 从 A 指向 B 的 引用 更 新 为 从 A 指向 C 之 后 的 状态 ， 然 后 再 删除 从 
B 指向 C 的 引用 ， 就 成 了 图 8.3(e) 这 样 。 

那么 ， 这 个 时 候 如 果 重 新 开始 标记 阶段 会 发 生 什 么 事 呢 ? B 原本 是 灰色 对 象 ， 经 过 搜索 
后 被 涂 成 了 黑色 。 然 而 尽管 C 是 活动 对 象 ， 程 序 却 不 会 对 它 进行 搜索 。 这 是 因为 已 经 搜索 完 
有 唯一 指向 C 的 引用 的 A 了。 

像 这 样 单纯 将 GC 标记 - 清除 算法 进行 增 量 ， 搞 不 好 会 造成 活动 对 象 的 “标记 遗漏 ”。 一 
旦 发 生 标 记 遗 漏 ， 就 会 造成 在 清除 阶段 中 错误 回收 活动 对 象 这 种 重大 的 问题 。 

在 这 里 我 们 回头 看 图 8.3(ce)， 问 题 的 原因 出 在 从 黑色 对 象 指向 白色 对 象 的 指针 上 。 一旦 
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产生 这 种 指针 ， 活 动 对 象 就 不 会 被 标记 。 
为 了 防止 发 生 这 种 情况 ， 在 改写 指针 时 需要 进行 一 些 处 理 ， 于 是 我 们 在 第 7 童 中 介绍 的 
写 人 屏障 又 再 次 登场 了 。 


8.1.5 ” 写 入 屏障 


分 代 垃圾 回收 中 用 到 的 写 入 屏障 ， 事实 上 在 增 量 式 垃圾 回收 里 也 起 着 重要 的 作用 。 这 里 
我 们 来 看 一 下 Edsger W. Dijkstra 等 人 提出 的 写 和 屏障， 详情 如 代码 清单 8.5 所 示 05。 


代码 清单 8.5: Dijkstra 的 写 入 屏障 
1 | write_barrier(obj, field, newobj){ 
if (newobj.mark == FALSE) 
newobj.mark = TRUE 
push(newobj, $mark_stack) 











*field = newobj 


3 





A DD 


如 果 新 引用 的 对 象 newobj 没有 被 标记 ,那么 就 将 其 标记 后 堆 到 标记 栈 里 。 换 名 话说 ， 
如 果 newobj 是 白色 对 象 ， 就 把 它 涂 成 灰色 。 
下 面 让 我 们 来 看 看 如 何 通 过 这 个 写 入 屏障 来 防止 图 8.3 中 的 标记 遗漏 问题 。 请 看 图 8.4。 
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图 8.4 Dijkstra 的 写 入 屏障 


请 大 家 注意 图 8.4(b)。 可 以 看 到 ， 这 里 不 仅 将 从 A 指向 B 的 指针 更 新 为 了 从 A 指向 C， 
还 将 C 从 日 色 涂 成 了 灰色 。 

即使 在 mutator 更 新 指针 后 的 图 8.4(e) 中 ， 也 没有 产生 从 黑色 对 象 指向 白色 对 象 的 引用 。 
这 样 一 来 我 们 就 成 功 地 防止 了 标记 遗漏 。 


8.1.6 ”清除 阶段 


当 标 记 栈 为 空 时 ，GC 就 会 进入 清除 阶段 。 清 除 阶 段 比 标记 阶段 要 简单 ， 如 代码 清单 8.6 
所 示 。 
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代码 清单 8.6: incremental_sweep_phase() 函数 


1 | incremental_sweep_phase(){ 

2 swept_count = 0 

3 while(swept_count < SWEEP_MAX) 

4 if($sweeping < $heap_end) 

5 if($sweeping.mark == TRUE) 

6 $sweeping.mark = FALSE 

7 else 

8 $sweeping.next = $free_list 
9 $free_list = $sweeping 

10 $free_size += $sweeping.size 
相生 

12 $sweeping += $sweeping.size 
13 swept_count++ 

14 else 

15 $gc_phase = GC_ROOT_SCAN 

16 return 

17 | 二 








我 们 只 是 对 第 2 章 中 出 现 的 sweep_phase() 函数 稍微 动 了 动手 脚 ， 就 将 其 变 成 了 
incremental_sweep_phase() 困 数 。 

基本 上 讲 ， 该 函数 所 进行 的 操作 就 是 把 没 被 标记 的 对 象 连接 到 空 亲 链表， 取消 已 标记 的 
对 象 的 标志 位 。 

然而 ， 为 了 只 对 一 定 个 数 的 对 象 执行 清除 操作 ， 需 要 事先 使 用 swept_count 变量 来 记 
录 已 清除 ae rm te 再 次 执行 
mutator。 当 把 堆 全 部 清除 完毕 时 ， 就 将 $gc_phase 设 为 GCC_R00T_SCAN， 结 束 GCC。 


8.1.7 “分配 
这 里 的 分 配 也 和 停止 型 GC 标记 - 清除 算法 中 的 分 配 没 什么 两 样 。 


代码 清单 8.7: newobj() 函数 























全 


1 | newobj(size){ 

2 if($free_size < HEAP_SIZE * GC_THRESHOLD) 

3 incremental_gc() 

4 

5 chunk = pickup_chunk(size, $free_list) 

6 if(chunk != NULL) 

六 chunk .size = size 

8 $free_size -= size 

9 if($gc_phase == GC_SWEEP && $sweeping <= chunk) 
10 chunk.mark = TRUE 
中 站 
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12 return chunk 

13 else 

14 allocation_fail() 
15 |} 


首先 在 第 2 行 调查 分 块 的 总 量 ， 如 果 分 块 的 总 量 $free_size 少 于 一 定 的 量 (HEAP_SIZE 
的 GC_THRESHOLD 倍 )， 就 执行 GC 

停止 型 GC 是 在 分 所 完全 村 渴 后 才 启动 的 。 然 而 ， 因 为 增 量 式 垃圾 回收 是 逐步 推进 GC 的 ， 
所 以 只 调用 一 次 incremental_gc() 函数 ,分 块 的 量 不 会 增加 。 因 此 在 分 块 枯竭 前 ， 我 们 需 
要 项 下 心 来 ， 稳 步 推进 GC 的 处 理 。 

第 5 行 的 pickup_chunk() 函数 被 用 于 搜索 空 闪 链表， 返回 大 小 大 于 等 于 size 的 分 块 。 
大 家 想必 还 记得 吧 ， 该 函数 在 第 2 章 中 也 出 现 过 。 

在 分 配 了 分 块 的 情况 下 ， 接 下 来 在 第 7 行 设 定 分 块 的 大 小 ， 在 第 8 行 对 $free_size 进 
行 size 大 小 的 减 量 。 如 果 在 这 里 将 这 个 分 块 返回 mutator 就 危险 了 

在 清除 阶段 中 进行 这 项 分 配 的 情况 下 ， 如 果 不 给 分 配 的 对 象 设 置 标志 位 ， 它 们 就 有 可 能 
被 GC 回收 掉 。 因 此 在 第 9 行 调查 现在 GC 有 没有 进入 清除 阶段 ， 且 chunk 在 不 在 已 清除 完 
毕 的 空间 里 。 如 果 chunk 在 已 清除 完毕 的 空间 里 ， 就 不 用 做 什么 处 理 。 如 果 chunk 在 没有 被 
清除 完毕 的 空间 里 ， 就 要 在 第 10 行 明 确 地 设置 标志 位 。 

这 两 种 情况 下 的 处 理 分 别 如 图 8.5(a) 和 图 8.5(b) 所 示 。 

如 果 在 代码 清单 8.7 的 第 5 行 没 能 分 配 分 块 ， 分 配 就 失败 了 。 


什么 都 不 做 


(a) [| 


chunk 



























































已 清除 完毕 的 空间 | 


$sweeping 














已 清除 完毕 的 空间 | 


$sweeping 


图 8.5 ”清除 阶段 中 的 分 配 


174 第 8 章 增 量 式 垃 圾 回收 


:部 入 优点 和 缺点 


8.2.1 ”缩短 最 大 暂停 时 间 
增 量 式 垃圾 回收 不 是 一 口气 运行 GCC， 而 是 和 mutator 交替 运行 的 ， 因 此 不 会 长 时 间 妨 碍 
到 mutator 的 运行 。 


增 量 式 垃圾 回收 适合 那些 比 起 提高 吞吐 量 ， 更 重视 缩短 最 大 暂停 时 间 的 应 用 程序 。 


8.2.2 ”降低 了 吞吐 量 

就 像 我 们 在 第 7 章 中 所 说 的 那样 ， 只 要 用 到 写 人 屏障， 就 会 增加 额外 负担 。 在 分 代 垃 圾 
回收 里 ， 我 们 还 能 盼 着 通过 缩短 GC 时 间 来 抵消 写 人 屏障 带 来 的 额外 负担 ， 但 在 增 量 式 GC 
里 就 不 用 想 了 。 因 为 我 们 的 目的 毕竟 是 缩短 最 大 暂停 时 间 ， 所 以 就 要 有 做 出 一 定 的 牺牲 的 心 
理 准备 。 

如 前 所 述 ， 想 要 优先 提高 吞吐 量 ， 最 大 暂停 时 间 就 会 增加 ; 想 要 优先 缩短 最 大 暂停 时 间 ， 
吞吐 量 就 会 恶化 。 这 两 者 是 一 个 权衡 关系 。 至 于 要 优先 哪 一 方 ， 则 要 根据 应 用 程序 而 定 。 


8.3 


在 这 里 我 们 为 大 家 介绍 一 下 1975 年 由 Guy L. Steele, Jr. 开发 的 算法 5。 这 个 算法 中 使 
用 的 写 人 屏障 要 比 Dijkstra 的 写 人 屏障 条 件 更 严格 ， 它 能 减少 GC 中 错误 标记 的 对 象 。 
8.3.1 ”mark() 函数 


Steele 的 算法 中 的 mark() 函数 和 Dijkstra 的 算法 中 的 mark() 函数 有 些 不 同 ， 请 看 代码 
清单 8.8。 



























































代码 清单 8.8: mark() 函数 

1 | mark(obj)t{ 

2 if(obj.mark == FALSE) 
3 push(obj，$mark_stack) 
4|} 
代码 清单 8.8 和 代码 清单 8.3 的 不 同 之 处 在 于 ， 在 把 对 象 堆积 到 标记 栈 时 还 没有 标记 
obj。 在 这 个 算法 中 ， 在 从 标记 栈 中 取出 对 象 时 才 为 其 设置 标志 位 。 也 就 是 说 ,这 里 的 灰色 
对 象 是 “ 堆 在 标记 栈 里 的 没有 设置 标志 位 的 对 象 ”， 黑 色 对 象 是 “设置 了 标志 位 的 对 象 ”。 
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8.3.2 写 入 屏障 
Steele 的 写 入 屏障 的 伪 代 码 如 代码 清单 8.9 所 示 。 
代码 清单 8.9: Steele 的 写 入 屏障 


1 | write_barrier(obj, field, newobj){ 
if($gc_phase == GC_MARK && 
obj .mark == TRUE && newobj.mark == FALSE) 
obj.mark = FALSE 


2 
3 
4 
5 push(obj, $mark._stack) 
6 
7 *field = newobj 

8 


} 





当 $gc_phase == GC_MARK、 obj.mark == TRUE 日 newobj.mark == FALSE 时 ,将 obj. 
mark 设 定 为 FALSE， 将 obj 堆积 到 标记 栈 里 。 也 就 是 说 ， 如 果 在 标记 过 程 中 发 出 引用 的 对 象 
是 黑色 对 象 ， 且 新 的 引用 的 目标 对 象 为 灰色 或 白色 ， 那 么 我 们 就 把 发 出 引用 的 对 象 涂 成 灰色 。 

证 我 们 来 确认 一 下 ， 通 过 这 个 写 入 屏障 是 否 彻底 防止 了 标记 遗漏 。 请 看 图 8.6。 
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图 8.6 ”Steele 的 写 入 屏障 


由 图 可 知 ， 写 入 屏障 在 图 8.6(a) 到 图 8.6(b) 中 发 挥 了 作用 ， 对 象 A 被 涂 成 了 灰色 。 结 
图 8.6(e) 中 就 不 存在 从 黑色 对 象 指向 白色 对 象 的 指针 ， 也 就 不 会 出 现 把 活动 对 象 标记 遗漏 的 
状况 了 。 

Steele 的 写 入 屏障 相 比 Dijkstra 的 写 入 屏障 来 说 ，if 语句 的 条 件 要 严格 一 些 。 也 就 是 说 ， 
相应 地 写 和 人 屏障 带 来 的 额外 负担 会 增 大 。 

然而 另 一 方面 ， 标 记 对 象 有 很 严格 的 限制 条 件 。 举 个 例子 ， 图 8.6(a) 里 的 黑色 对 象 A 在 
图 8.6(c) 里 变 成 了 灰色 。 也 就 是 说 ， 对 象 A 被 再 次 搜索 了 。 在 这 里 我 们 假设 在 搜索 对 象 A 
之 前 C 已 经 成 了 垃圾 ， 这 样 一 来 当 我 们 搜索 对 象 A 时 ， 就 无 法 对 C 进行 标记 了 。 

而 Dijkstra 的 写 和 人 屏障 又 如 何 呢 ? 在 Dijkstra 的 写 和 人 屏障 中 ， 因 为 已 经 把 对 象 C 涂 成 了 
灰色 ， 所 以 即使 之 后 对 象 C 成 了 垃圾 ， 程序 也 会 对 其 进行 搜索 。 结 果 垃 圾 对 象 C 以 及 从 C 
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引用 的 其 他 垃圾 对 象 都 遗留 了 下 来 。 
Steele 的 写 和 人 屏障 通过 限制 标记 对 象 来 减少 被 标记 的 对 象 ， 从 而 防止 了 因 玻 忽而 造成 垃 
圾 残留 的 后 果 。 


:于 汤 浅 的 算法 


下 面 我 们 将 为 大 家 介绍 1990 年 汤 浅 太一 开发 的 算法 所。 使 用 汤 浅 的 写 入 屏障 的 算 
法 ， 也 称 为 “快照 CC”(Snapshot CC)。 这 是 因为 这 种 算法 是 以 GC 开始 时 对 象 间 的 引用 关系 
(snapshot ) 为 基础 来 执行 GC 的 。 因 此 ,根据 汤 浅 的 算法 ,在 GC 开始 时 回收 垃圾 ,保留 GC 
开始 时 的 活动 对 象 和 GC 执行 过 程 中 被 分 配 的 对 象 。 


8.41 标记 阶段 
汤 浅 算法 中 的 标记 阶段 如 代码 清单 8.10 所 示 。 


代码 清单 8.10: incremental_mark_phase() 函数 
incremental_mark_phase(){ 
for(i : 1..MARK_MAX) 
if(is_empty($mark_stack) == FALSE) 
obj = pop($mark_stack) 
for(child : children(obj)) 
mark(*child) 























else 
$gc_phase = GC_SWEEP 
$sweeping = $heap_start 


return 


[ed 
PO OO ON 人 oD Pe 


} 





标记 阶段 结束 时 的 处 理 比 代码 清单 8.4 要 简单 。 在 汤 浅 的 算法 中 ， 进 入 清除 阶段 前 没有 
必要 再 搜索 根 。 这 是 因为 该 算法 遵循 了 “以 GC 开始 时 对 象 间 的 引用 关系 为 基础 执行 GC” 这 
项 原则 。 

在 标记 阶段 中 新 的 从 根 引用 的 对 象 在 GC 开始 时 应 该 会 被 别 的 对 象 所 引用 。 因 此 ， 搜 索 
GC 开始 时 就 存在 的 指针 ， 就 会 发 现 这 个 对 象 已 经 在 标记 阶段 被 标记 完毕 了 ， 所 以 没有 必要 
从 新 的 根 重新 标记 它 。 这 样 一 来 就 可 以 轻松 地 进行 CC 所 必需 的 处 理 。 


8.4.2 ”从 黑色 对 象 指向 白色 对 象 的 指针 


在 8.1.4 节 中 我 们 提 到 了 通过 写 人 屏障 来 防止 产生 从 黑色 对 象 指 向 白色 对 象 的 指针 ， 然 
而 就 像 我们 之 后 看 到 的 那样 ， 汤 浅 的 写 和 人 屏障 里 允许 有 从 黑色 对 象 指向 白色 对 象 的 指针 。 为 
什么 这 样 还 能 顺利 地 进行 垃圾 回收 呢 ? 秘密 就 在 这 个 算法 的 原则 里 。 汤 浅 的 算法 是 基于 在 
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GC 开始 时 保留 活动 对 象 这 项 原则 的 。 
遵循 这 项 原则 ， 就 没有 必要 在 新 生成 指针 时 标记 引用 的 目标 对 象 了 。 即 使 生成 了 从 黑色 
对 象 指 向 白色 对 象 的 指针 ， 只 要 保留 了 GC 开始 时 的 指针 ， 作 为 引用 目标 的 白色 对 象 早 晚 就 
会 被 标记 。 

其 实 指针 被 删除 时 的 情况 更 应 该 引起 我 们 的 注意 。 指 向 对 象 的 指针 一 经 删除 ， 就 可 能 
法 保留 GC 开始 时 的 活动 对 象 了 。 因 此 在 汤 浅 的 写 和 人 屏障 里 ， 在 删除 指向 对 象 的 指针 时 要 进 
行 一 些 特 殊 的 处 理 。 


8.4.3 ” 写 入 屏障 
汤 浅 的 算法 里 的 写 入 屏障 的 伪 代 码 如 代码 清单 8.11 所 示 。 
代码 清单 8.11: 汤 浅 的 写 入 屏障 


1 | write_barrier(obj, field, newobj){ 

oldobj = *field 

if(gc_phase == GC_MARK && oldobj.mark == FALSE) 
oldobj.mark = TRUE 
push(oldobj, $mark_stack) 





*field = newobj 


} 





oo 和 DO wm Dh 


在 汤 浅 的 写 入 屏障 中 ， 当 GC 进入 到 标记 阶段 且 oldobj 没 被 标记 时 ， 则 标记 oldobj， 
并 将 其 堆 到 栈 里 。 
也 就 是 说 ， 在 标记 阶段 中 如 果 指 针 更 新 前 引用 的 oldobj 是 白色 对 象 ， 就 将 其 涂 成 灰色 。 
下 面 让 我 们 来 看 看 如 何 使 用 这 个 写 入 屏障 来 防止 出 现 图 8.3 中 的 标记 遗漏 问题 。 请 看 图 8.7。 
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图 8.7 汤 浅 的 写 入 屏障 


在 从 图 8.7(b) 转移 到 图 8.7(c) 的 过 程 中 写 和 屏障 发 挥 了 作用 , 它 把 C 涂 成 了 灰色 ,这样 
一 来 就 防止 了 C 的 标记 遗漏 。 
请 大 家 注意 ， 当 处 于 图 8.7(b) 这 种 情况 时 生成 了 从 黑色 对 象 指 向 白色 对 象 的 指针 。 因 为 
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从 B 指 向 C 的 指针 留 了 下 来 ,所 以 汤 浅 的 写 入 屏障 在 这 时 候 不 会 进行 特殊 的 处 理 。 只 有 当 
从 B 指 向 C 的 指针 被 删除 时 ，C 才 会 被 涂 成 灰色 。 


8.4.4 ”分配 
在 汤 浅 的 算法 里 ， 分 配 如 代码 清单 8.12 所 示 。 


代码 清单 8.12: newobj() 函数 
1 | newobj(size){ 
if($free_size < HEAP_SIZE * GC_THRESHOLD) 
incremental_gc() 


if(chunk != NULL) 


2 
3 
4 
5 chunk = pickup_chunk(size, $free_list) 
6 
7 chunk.size = size 

8 





$free_size -= size 
9 if($gc_phase == GC_MARK) 
10 chunk.mark = TRUE 
4 else if($gc_phase == GC_SWEEP && $sweeping <= chunk) 
12 chunk.mark = TRUE 
13 return chunk 
14 
15 else 
16 allocation_fail() 
ji 


代码 清单 8.12 大 体 上 和 代码 清单 8.7 很 相似 ,不 过 第 9 行 和 第 10 行 却 有 所 不 同 。 在 汤 
浅 的 算法 里 ， 在 标记 阶段 进行 分 配 时 会 无 条 件 设置 obj 的 标志 位 。 也 就 是 说 ， 会 把 obj 涂 成 
黑色 。 这 里 比 代码 清单 8.7 要 保守 一 些 。 汤 浅 的 算法 中 写 和 人 屏障 相对 简单 ， 所 以 保留 了 很 多 
对 象 ， 可 是 最 后 事实 上 却 无 意 间 保留 了 很 多 垃圾 对 象 。 

清除 阶段 中 的 分 配 处 理 则 与 代码 清单 8.7 完全 一 致 。 


:前 比较 各 个 写 入 屏障 


下 面 我 们 用 表格 来 简单 地 对 比 一 下 本 章 中 介绍 的 3 种 写 入 屏障 ,它们 所 进行 的 操作 以 及 
执行 这 些 操作 所 需要 的 条 件 如 表 8.1 所 示 。 


表 8.1 ”比较 3 个 写 入 屏障 


Dijkstra 将 C 涂 成 灰色 





Steele 起 将 A 恢复 为 灰色 
汤 淡 ; 将 C 涂 成 灰色 
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这 样 看 来 ， 它 们 3 个 各 不 相同 。 实 际 上 不 仅 是 写 和 屏障， 在 分 配 等 方面 也 存在 着 差异 ， 
所 以 我 们 没 法 简单 地 进行 比较 。 不 过 即使 存在 着 这 么 大 的 差异 ， 各 种 写 人 屏障 也 都 能 顺畅 运 
行 ， 这 一 点 是 比较 耐人寻味 的 。 





RC Immix 算法 





本 章 将 为 大 家 介绍 2013 年 由 Rifat Shahriyar 等 人 开发 的 RC Immix 算法 (Reference 
Counting Immix)P27。 


RC Immix 算法 将 引用 计数 法 的 一 大 缺点 一 一 吞吐 量 低 改 善 到 了 实用 级 别 。 本 算法 将 改 
善 了 引用 计数 法 的 “合并 型 引用 计数 法 ”(Coalesced Reference Counting ) El 和 我 们 在 第 5 章 中 
介绍 的 Immix 组 合 了 起 来 。 因 此 ， 本 章 中 首先 要 介绍 合并 型 引用 计数 法 。 


; 序 俐 | 合并 型 引用 计数 法 


合并 型 引用 计数 法 是 2001 年 由 Yossi Levanoni 和 Erez Petrank 开发 的 算法 。 

在 第 3 章 中 我 们 向 大 家 说 明 过 ,在 吞吐 量 方面 ， 引 用 计数 法 比 不 上 搜索 型 CC。 原因 之 
一 就 是 “计数 需 增 减 频 繁 ”。 举 个 例子 ， 某 个 对 象 A 和 对 象 B 的 计数 器 的 变化 如 图 9.1 所 示 。 

在 从 (a) 到 (d) 的 过 程 中 ,每 当 X 的 指针 发 生变 更 ，A 和 B 的 计数 器 部 会 有 所 增 减 。 像 
这 样 ， 在 引用 计数 法 中 ， 每 当 对 象 间 的 引用 关系 发 生变 化 ， 都 要 增 减 该 对 象 的 计数 器 ， 以 保 
证 其 数值 一 直 是 正确 的 。 众 所 周知 ， 这 是 通过 写 入 屏障 实现 的 。 如 果 计 数 器 频繁 发 生 增 减 ， 
那么 写 和 人 屏障 的 执行 频率 就 会 增加 ， 处 理 就 会 变 得 楷 重 。 

在 这 里 我 们 要 注意 一 个 容易 被 忽略 的 事实 。 如 果 对 同一 个 对 象 分 别 进行 一 次 增 量 和 减 量 操作 ， 
因为 两 者 会 互相 抵消 ， 所 以 最 终 计 数 器 的 值 并 没有 变化 。 举 个 例子 ,在 图 9.1 中 ， 因 为 的 
dec_ref_cnt(A) 和 人 (的 inc_ref_cnt(A) 抵消 了 ， 所 以 (a) 和 (c) 中 A 的 计数 器 值 没有 发 生 
变化 。 同 理 , (i 的 inc_ref_cnt(B) 和 (全 的 dec_ref_cnt(B) 也 一 样 。 

由 此 可 知 ， 比 起 一 直 保 持 计数 需 的 正确 状态 ， 通 过 使 计数 器 的 增 量 和 减 量 互相 抵消 ， 更 
引 有 效 地 管理 计数 器 。 

于 是 人 们 开发 出 了 一 种 方法 ,就 是 把 注意 力 放 在 某 一 时 期 最 初 和 最 后 的 状态 上 ， 在 该 期 
间 内 不 进行 计数 需 的 增 减 。 这 就 是 合并 型 引用 计数 法 (Coalesced Reference Counting)。 在 合 
并 型 引用 计数 法 中 ， 即 使 指针 发 生 改 动 ， 计 数 器 也 不 会 增 减 。 指 针 改 动 时 的 信息 会 被 注册 到 
更 改 缓冲 区 (Modified Buffer)。 
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XxX 
(a) \ ) 与 GC 相关 的 处 理 
| 
A B (D 
A inc_ref_cnt(B) 
要 dec_ref_cnt(A) 
(b) \ - ) 
| 中 加 -| 有 
秋 B (i) 
1) inc_ref_cnt (A) 
x dec_ref_cnt(B) 
1 
A B QD 
4) inc_ref_cnt(B) 
x dec_ref_cnt (A) 
ee 
| - | | | 


图 9.1 引用 计数 法 中 计数 器 的 变化 


如 果 在 对 象 间 的 引用 关系 发 生变 化 时 计数 融 没 有 增 减 的 话 ， 就 会 导致 有 一 段 时 间 计 数 需 
值 是 错误 的 。 不 过 这 中 我 们 在 第 3 章 中 介绍 的 “延迟 引用 计数 法 ”没什么 两 样 。 在 延迟 引用 
计数 法 中 ， 如 果 ZCT 满 了 的 话 ， 我 们 就 要 查找 ZCT， 重 新 正确 设置 计数 需 的 值 。 

男 一 方面 ， 在 合并 型 引用 计数 法 中 要 将 指针 发 生 改 动 的 对 象 和 其 所 有 子 对 象 注册 到 更 改 
缓冲 区 中 。 这 项 操作 是 通过 写 和 人 屏障 来 执行 的 。 不 过 因为 这 时 候 我 们 不 更 新 计数 器 ， 所 以 计 
数 需 会 保持 错误 的 值 。 图 9.10) 中 将 对 象 注册 到 了 更 改 缓冲 区 ， 此 时 的 状态 如 图 9.2 所 示 。 
































更 改 缓冲 区 
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图 9.2 ”更 改 缓冲 区 
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我 们 将 指针 改动 了 的 X 和 指针 改动 前 被 X 引 用 的 A 注册 到 了 更 改 缓冲 区 。 因 为 没有 更 
新 计数 器 ,所 以 A 和 8B 的 计数 占 在 这 个 时 候 是 不 正确 的 。 这 点 请 大 家 注意 。 

等 到 更 改 缓冲 区 满 了 ,我们 就 要 运行 GCC。 合并 型 引用 计数 法 中 的 GC 指 的 是 查找 更 改 
缓冲 区 ， 并 正确 设置 计数 器 值 的 操作 。 通 过 查找 更 改 缓冲 区 ， 如 何 重新 正确 设 定 计数 器 的 值 
呢 ? 我 们 用 图 9.1 来 说 明 。 

首先 ，X 将 其 指针 从 A 变更 到 B。 此 时 我 们 把 X 和 其 子 对 象 A 注册 到 更 改 缓冲 区 (图 9.2 )。 

然后 ， 假 设 X 的 原 引 用 对 象 发 生 了 B 一 A 一 B 这 样 的 变化 。 因 为 我 们 已 经 把 X 注 册 到 
更 改 缓冲 区 了 ， 所 以 没 必 要 重新 进行 注册 。 

接 下 来 ,假设 在 (d) 阶段 更 改 缓冲 区 满 了 ， 这 时 就 该 启动 GC 了 。 首 先 查 找 更 改 缓冲 区 ， 
据 此 我 们 可 以 得 到 以 下 这 些 信息 。 























1.X 在 (人 的 阶段 (也 就 是 注册 到 更 改 缓冲 区 时 ) 引 用 的 是 A 
2. 义 现在 引用 的 是 B 


因此 需要 像 下 面 这 样 ， 合 理 调整 各 对 象 的 计数 器 。 





1. 对 A 的 计数 器 进行 减 
2. 对 B 的 计数 器 进 和 


在 合并 型 引用 计数 法 中 ,计数器 的 变化 如 图 9.3 所 示 。 

可 见 ， 和 图 9.1 所 示 的 单纯 的 引用 计数 法 相 比 ， 合 并 型 引用 计数 法 中 计数 器 的 增 减 次 数 
减少 ， 处 理 变 得 更 加 简单 。 

此 外 , 这 个 例子 中 只 出 现 了 A 和 B 这 两 个 X 的 引用 目标 对 象 。 不 过 ,即使 像 
A 一 C 一 D 一 人 一 B 这 样 中 途 引 用 更 多 的 对 象 ， 程 序 也 能 顺利 运行 。 请 大 家 试 着 确认 一 下 。 

上 面 我 们 简单 地 了 解 了 一 下 合并 型 引用 计数 法 的 概要 ， 下 面 就 用 伪 代 码 来 详细 看 一 
下 吧 。 
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图 9.3 合并 型 引用 计数 法 中 计数 器 的 变化 


9.2.1 _ 伪 代 码 
首先 是 写 入 屏障 。 
代码 清单 9.1: 合并 型 引用 计数 法 的 写 入 屏障 


1 | write_barrier_coalesced_RC(obj, field, dst){ 





2 if(!obj.dirty) 
3 register(obj) 
4 obj .field = dst 
5 | 了 




















这 里 的 写 入 屏障 和 单纯 的 引用 计数 法 中 的 写 人 屏障 不 同 ， 它 不 执行 计数 器 的 增 减 ， 而 是 
负责 检查 要 改动 指针 的 对 象 (obj ) 的 标志 (dirty) 是否 已 注册 完毕 ， 如 果 没 注册 ， 就 将 其 注 
册 到 更 改 缓冲 区 ($mod_buf )。 执 行 “ 注 册 到 更 改 缓冲 区 ”的 操作 的 是 register() 函数 ， 下 面 
我 们 来 看 一 下 。 
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代码 清单 9.2: register() 函数 
register (obj){ 


上 


if($mod_buf .size <= $mod_buf .used_size) 


garbage_collect() 


2 
3 
4 
5 entry.obj = obj 

6 foreach(child_ptr : children(obj)) 

7 if(*child_ptr != null) 

8 push(entry.children, *child_ptr) 
9 


10 push($mod_buf, entry) 
4 obj.dirty = true 
12 3} 





首先 ， 当 $mod_buf 满 了 的 时 候 ， 我 们 就 要 执行 GC 以 确保 有 足够 的 空间 。 

接 下 来 ,我们 在 第 5 行 到 第 8 行 准备 obj 的 信息 ， 以 将 其 注册 到 更 改 缓冲 区 。 这 个 
entry 是 指向 某 对 象 及 其 所 有 子 对 象 的 指针 的 集合 。 我 们 将 这 个 信息 作为 $mod_buf 的 一 个 
元 素 进行 注册 。 

在 第 11 行 设置 obj 的 dirtyflag， 表 明 已 经 将 其 注册 到 了 $mod_buf。 

最 后 我 们 来 看 看 执行 GC 的 函数 。 


代码 清单 9.3: garbage_collect() 函数 
1 | garbage_collect(){ 





foreach(entry : $mod_buf) 
obj = entry.obj 
foreach(child : obj) 
inc_ref_cnt (child) 
foreach(child : entry.children) 
dec_ref_cnt (child) 
obj.dirty = false 


‘OO on 中 ww 


10 clear ($mod_buf) 
和 | 二 




















就 像 我 们 上 面 讲 的 那样 ， 合 并 型 引用 计数 法 是 将 某 一 时 期 最 初 的 状态 和 最 后 的 状态 进行 
的 合理 调整 计数 器 的 算法 。 在 garbage_collect() 函数 中 ， 首 先 查找 $mod_buf ， 对 于 
经 注册 的 对 象 obj 进行 如 下 处 理 。 





1. 对 obj 现在 的 子 对 象 的 计数 器 进行 增 量 (第 4 行 、 第 5 行 ) 
2. 对 obj 以 前 的 子 对 象 的 计数 器 进行 减 量 (第 6 行 、 第 7 行 ) 
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第 1 项 处 理 负责 查看 某 个 时 期 “最 后 的 状态 *， 第 2 项 处 理 负责 查看 某 个 时 期 “最初 的 状 
态 "。 查 看 对 象 最 初 和 最 后 的 状态 后 ， 合 理 调整 计数 器 。 此 外 ， 跟 以 往 的 引用 计数 法 一 个 道理 ， 
先进 行 增 量 是 为 了 确保 A 和 了 是 同一 对 象 时 也 能 够 顺利 运行 。 


9.2.2 ”优点 和 缺点 


合并 型 引用 计数 法 的 优点 是 增加 了 吞吐 量 。 它 不 是 逐次 进行 计数 需 的 增 减 处 理 ， 而 是 在 
某 种 程度 上 一 并 执行 ， 所 以 能 无 视 增 量 和 减 量 相抵 消 的 部 分 。 尤 其 在 一 个 对 象 频 索 更 新 指针 
的 情况 下 ， 合 并 型 引用 计数 法 能 起 到 很 大 的 作用 。 

它 的 缺点 就 是 增加 了 mutator 的 暂停 时 间 ， 这 是 因为 在 查找 更 改 缓冲 区 的 过 程 中 需要 让 
mutator 暂停 。 当 然 ， 如 果 更 改 缓冲 区 的 大 小 比较 小 ， 就 能 相应 缩短 暂停 时 间 ， 不 过 这 种 情 
况 下 就 没 法 指望 增加 吞吐 量 。 这 方面 需要 我 们 加 以 权衡 好 好 调整 。 


; 素 测 合并 型 引用 计数 法 和 Immix 的 融合 


下 面向 大 家 说 明 怎么 将 合并 型 引用 计数 法 和 Immix 相 结合 。 

在 以 往 的 合并 型 引用 计数 法 中 ， 通 过 查找 更 改 缓冲 区 ,计数 絮 值 为 0 的 对 象 会 被 连接 到 
空闲 链表 ， 为 之 后 的 分 配 做 准备 。 可 见 这 和 单纯 的 引用 计数 法 是 一 样 的 。 

另 一 方面 ， 就 如 我 们 在 第 5 音 中 介绍 的 那样 ，Immix 中 不 是 以 对 象 为 单位 ， 而 是 以 线 为 
单位 进行 内 存 管理 的 ， 因 此 不 使 用 空 闪 链表。 如 果 线 内 一 个 活动 对 象 都 没有 了 ， 就 回收 整个 
线 。 只 要 线 内 还 有 一 个 活动 对 象 ， 这 个 线 就 无 法 作为 分 块 回收 。 

RC Immix 中 不 仅 对 象 有 计数 占 ， 线 也 有 计数 右 ， 这 样 就 可 以 获悉 线 内 是 否 存 在 活动 对 象 。 
不 过 线 的 计数 锅 和 对 象 的 计数 需 略 有 不 同 。 对 象 的 计数 需 表 示 的 是 指向 这 个 对 象 的 引用 的 数 
量 ， 而 线 的 计数 需 表 示 的 是 这 个 线 里 存在 的 活动 对 象 的 数量 。 如 果 这 个 数 变 成 了 0， 就 要 将 
线 整个 回收 。 图 9.4 表示 的 是 线 的 计数 需 。 


9.4” 线 的 计数 器 


















































































































































为 了 减少 额外 负担 ， 线 的 计数 带 里 记录 的 不 是 “指向 线 内 对 象 的 引用 的 数量 ”"， 而 是 “ 线 
内 活动 对 象 的 数量 " 。 对 象 生 成 和 废弃 的 频率 要 低 于 对 象 间 引 用 关系 变化 的 频率 ， 这 样 一 来 
更 新 计数 絮 所 产生 的 额外 负担 就 小 了 。 
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下 面 就 来 解释 一 下 RC Immix 中 是 如 何以 线 为 单位 进行 内 存 管理 的 吧 。 我 们 来 一 起 看 一 
下 dec_ref_cnt() 函数 。 





代码 清单 9.4: RC Immix 中 的 dec_ref_cnt() 函数 
dec_ref_cnt (obj){ 


上 


obj .ref_cnt=-- 
if(obj.ref_cnt == 0) 
Teclaim_obj(obj) 
line = get_line(obj) 
line.ref_cnt--— 
if(line.ref_cnt == 0) 


reclaim line(line) 





OO ON Dh 


} 


没有 什么 特别 难 的 地 方 。 当 对 象 的 计数 器 为 0 时， 对 线 的 计数 器 进行 减 量 操作 。 当 线 的 
计数 需 为 0 时 ， 我 们 就 可 以 将 线 整个 回收 再 利用 了 。 

这 样 一 来 ,我 们 就 成 功 地 将 合并 型 引用 计数 法 和 Immix 组 合 到 了 一 起 。 不 过 这 样 还 不 
完整 ， 因 为 虽然 把 内 存 管理 方法 从 以 对 象 为 单位 变 成 了 以 线 / 块 为 单位 ， 但 是 却 不 能 执行 
压缩 。 

在 压缩 中 要 进行 复制 对 象 的 操作 。 要 实现 这 项 操作 ， 不 仅 要 如 同 字面 意思 写 的 那样 复制 
对 象 ， 还 要 将 引用 此 对 象 的 指针 全 部 改写 。 不 过 单纯 的 引用 计数 法 中 不 会 搜索 堆 中 所 有 对 象 
的 指针 ， 而 是 只 在 对 象 间 的 引用 关系 发 生变 化 时 关注 变化 的 地 方 。 因 此 压缩 所 需要 的 信息 不 
足 ， 无 法 执行 。 

于 是 RC Immix 是 通过 限定 对 象 来 实现 压缩 的 。 这 里 的 对 象 即 新 对 象 ( New Object)， 下 面 
我 们 就 来 看 一 下 。 


9.3.1 ”新 对 象 


在 RC Immix 中 ,我 们 把 没有 经 历 过 GC 的 对 象 称 为 新 对 象 ， 以 区 别 于 其 他 对 象 。 大 家 
想必 还 记得 分 代 垃 圾 回收 中 也 有 大 臻 相同 的 概念 吧 。 之 所 以 这 么 区 别 ， 是 因为 通过 查找 更 改 
缓冲 区 ， 可 以 找到 所 有 指向 新 对 象 的 指针 。 我 们 来 详细 说 明 一 下 。 之 前 已 经 提 过 了 ， 新 对 象 
没有 经 历 过 GC。 也 就 是 说 ， 它 是 在 上 一 次 GC 之 后 生成 的 。 因 此 指向 新 对 象 的 所 有 指针 也 
是 在 上 一 次 GC 之 后 生成 的 。 

就 像 我们 在 9.2 节 中 所 说 的 那样 ， 更改 缓 冲 区 里 记录 的 是 从 上 一 次 GC 开始 到 现在 为 止 
首 针 改 动 过 的 对 象 。 

所 有 指向 新 对 象 的 指针 都 是 在 上 一 次 GC 之 后 生成 的 。 也 就 是 说 ， 所 有 引用 新 对 象 的 对 
象 都 被 注册 到 了 更 改 缓冲 区 。 

因此 ， 可 以 通过 查找 更 改 缓冲 区 来 只 对 新 对 象 进行 复制 操作 。 
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利用 这 条 性 质 ，RC Immix 中 以 新 对 象 为 对 象 进行 压缩 ， 这 称 为 被 动 的 碎片 整理 (Reactive 


Defragmentation ) », 


9.3.2 ”被 动 的 碎片 整理 


RC Immix 和 合并 型 引用 计数 法 一 样 ， 在 更 改 缓冲 区 满 了 的 时 候 都 会 查找 更 改 缓冲 区 ， 
这 时 如 果 发 现 了 新 对 象 ， 就 会 把 它 复 制 到 别 的 空间 去 。 这 项 处 理 和 前 面 第 4 章 的 GC 复制 算 
法 以 及 第 5 章 的 Immix GC 的 内 容 基 本 一 致 。 

我 们 准备 一 个 空 的 块 来 当 作 目 标 空间 。 在 复制 过 程 中 目标 空间 满 了 的 情况 下 ， 就 新 采用 
一 个 空 的 块 。 我 们 不 对 旧 对 象 执行 被 动 的 碎片 整理 。RC Immix 中 的 garbage_collect() 函 
数 如 代码 清单 9.5 所 示 。 


代码 清单 9.5: RC Immix 中 的 garbage_collect() 函数 





1 | garbage_collect(){ 

2 dst_block = get_empty_block() 

3 foreach(entry : $mod_buf) 

4 obj = entry.obj 

5 foreach(child_ ptr : children(obj)) 
6 inc_ref_cnt (*child_ptr) 

7 if(!(*child_ptr) .old) 

8 reactive_defrag(child_ptr, dst_block) 
9 foreach(child : entry.children) 

10 dec_ref_cnt (child) 

11 obj.dirty = false 

12 |} 





这 里 的 garbage_collect() 函数 和 合并 型 引用 计数 法 中 的 garbage_collect() 函数 很 像 。 
基本 流程 都 是 查找 更 改 缓冲 区 ， 根 据 情 况 进 行 增 量 或 减 量 操作 。 代 码 清单 9.5 和 代码 清单 9.3 
的 不 同 之 处 在 于 第 8 行 。 这 里 对 新 对 象 调 用 了 reactive_defrag() 为 数 ， 这 就 是 被 动 的 碎片 
整理 。 那 么 我 们 来 看 看 reactive_defrag() 函数 吧 。 














代码 清单 9.6: reactive_defrag() 函数 
1 | reactive_defrag(ptr, dst_block){ 
obj = *ptr 
if (obj.copied) 
*ptr = obj.forwarding 
else 


if(obj.size > dst_block.free_size) 


DO mw Nb 





dst_block = get_empty_block() 




















Qz 碎片 整理 : 跟 Windows 对 文件 系统 进行 碎片 化 整理 的 工具 一 样 ， 这 是 一 项 整理 碎片 的 处 理 ， 和 压缩 是 一 个 意思 。 
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8 new_obj = dst_block.free_top 

9 copy_data(obj, new_obj, obj.size) 
10 obj.forwarding = new_obj 

站 二 *ptr = new_obj 

12 obj .copied = true 

13 new_obj.old = true 

14 dst_block.free_top += obj.size 
15 dst_block.free_size -= obj.size 
16 

7 line = get_line(obj) 

18 line.ref_cnt++ 

19 |} 





大 家 也 看 到 了 ， 复 制 对 象 并 设 定 forwarding 指针 的 处 理 和 我 们 在 第 4 章 中 介绍 的 Cheney 
的 GC 复制 算法 是 相同 的 。 在 RC Immix 中 我 们 还 需要 留意 线 的 计数 器 。 将 对 象 复制 到 线 时 ， 
也 要 对 线 的 计数 需 进 行 增 量 。 
通过 被 动 的 碎片 整理 ， 就 可 以 以 引用 计数 法 为 基础 来 执行 压缩 了 。 

不 过 ， 光 这 样 还 不 够 。 被 动 的 碎片 整理 只 会 对 活动 对 象 中 的 新 对 象 进行 压缩 。 这 样 一 来 ， 
随 着 程序 的 逐步 运行 ， 旧 对 象 可 能 会 导致 碎片 化 。 此 外 ， 因 为 我 们 是 以 引用 计数 法 为 基础 的 ， 
所 以 不 能 回收 循环 垃圾 。 为 了 解决 如 上 问题 ,在 RC Immix 里 还 要 进行 一 项 压缩 ， 那 就 是 积 
极 的 碎片 整理 (Proactive Defragmentation )。 


9.3.3 ”积极 的 碎片 整理 
被 动 的 碎片 整理 有 两 处 缺陷 。 



































1 . 无 法 对 旧 对 象 进行 压缩 
2. 无 法 回收 有 循环 引用 的 垃圾 





为 了 解决 这 些 问题 ， 在 RC Immix 中 除了 进行 被 动 的 碎片 整理 之 外 ， 还 要 进行 男 一 项 操作 。 
为 了 使 两 者 形成 对 比 ， 我 们 称 其 为 积极 的 碎片 整理 。 

首先 决定 要 复制 到 哪个 块 ， 然 后 把 能 够 通过 指针 从 根 查 找到 的 对 象 全 部 复制 过 去 。 这 里 
用 到 的 是 之 前 在 第 5 章 中 介绍 的 基本 的 GC 标记 - 压缩 算法 。 
通过 积极 的 碎片 整理 ,“ 对 旧 对 象 进行 压缩 ”和 “回收 循环 垃圾 ”都 成 为 了 可 能 。 不 过 它 
还 有 一 个 好 处 ， 那 就 是 可 以 重 置 计数 器 。 以 引用 计数 法 为 基础 时 ,一般 都 会 利用 Sticky 引用 
计数 法 。 在 Sticky 引用 计数 法 中 ， 如 果 茶 个 对 象 发 生计 数 天 溢出， 那么 之 后 就 不 能 对 其 计数 
需 进 行 增 减 ， 只 能 就 此 搁置 。 不 过 ， 如 果 执 行 积极 的 碎片 整理 ， 就 会 重新 从 根 查 找 所 有 指针 ， 
也 就 能 重新 设 定 计数 需 的 值 。 这 样 一 来 ， 有 时 不 属于 内 存 管 理 范围 之 内 的 对 象 也 能 被 归 到 内 
存 管理 范围 之 内 了 。 
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与 被 动 的 碎片 整理 相 比 ， 积 极 的 碎片 整理 处 于 辅助 性 的 位 置 ， 因 此 不 应 该 太 过 频繁 地 执 
行 。 当 分 块 的 总 大 小 下 降 到 一 定 值 ( 例 如 全 体 堆 的 10% ) 时 再 执行 它 为 好 。 


9.4 


9.4.1 “优点 


通过 RC Immix， 引 用 计数 法 最 大 的 缺点 一 一 吞吐 量 低 得 到 了 大 幅度 的 改善 。 据 论文 记载 ， 
与 以 往 的 引用 计数 法 相 比 ， 其 吞吐 量 平均 提升 了 12%。 根 据 基 准 测试 程序 的 情况 ， 甚 至 会 超 
过 搜索 型 GC。 

吞吐 量 得 到 改善 的 原因 有 两 个 。 其 一 是 导入 了 合并 型 引用 计数 法 。 因 为 没有 通过 写 入 屏 
障 来 执行 计数 器 的 增 减 操作 ， 所 以 即使 对 象 间 的 引用 关系 频繁 发 生变 化 ,吞吐 量 也 不 会 下 降 
太 多 。 

另 一 个 原因 是 撤除 了 空闲 链表 。 通 过 以 线 为 单位 来 管理 分 块 ， 只 要 在 线 内 移动 指针 就 可 
以 进行 分 配 了 。 此 外 ， 这 里 还 省 去 了 把 分 块 重新 连接 到 空闲 链表 的 处 理 。 这 部 分 我 们 在 第 4 
章 讲 GC 复制 算法 的 优点 时 已 经 解释 过 了 。 


9.4.2 ”缺点 


RC Immix 和 合并 型 引用 计数 法 一 样 ， 都 会 增加 暂停 时 间 。 不 过 如 前 所 述 ， 可 以 通过 调 
整 更 改 缓冲 区 的 大 小 来 缩短 暂停 时 间 。 

另 一 个 缺点 是 “只 要 线 内 还 有 一 个 非 垃 圾 对 象 ， 就 无 法 将 其 回收 "。 在 线 的 计数 融 是 1 ， 
也 就 是 说 线 内 还 有 一 个 活动 对 象 的 情况 下 ， 会 日 白 消耗 大 部 分 线 。 
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10.1 


在 了 解 Python 的 垃圾 回收 之 前 ， 我 们 先 来 做 一 些 准 备 工作 吧 。 关 于 Python 的 语言 知识 ， 
我 们 会 在 “附录 ”中 进行 说 明 。 有 些 读者 可 能 想 问 Python 这 东西 到 底 是 什么 ， 请 往 下 看 。 


10.1.1 Python 是 什么 


Python 是 Guido van Rossum 开发 的 一 种 动态 类 型 、 面 向 对 象 的 脚本 语言 。 
Python 比较 著名 的 特征 有 以 下 两 点 。 














这 些 特征 来 源 于 Python 的 开发 策略 ， 即 “采用 方便 直接 的 语法 ， 不 采用 方便 但 复杂 的 语 
法 ”。 不 过 本 书 中 基本 上 没有 涉及 Python 出 色 的 语法 ， 敬 请 谅解 。 





10.1.2 ”Python 的 源 代码 
这 次 我 们 要 为 大 家 讲解 的 GC 是 由 Guido 主导 开发 的 原创 的 Python 解释 器 ,采用 的 版 本 
是 本 书 执笔 时 (2009 年 6 月 10 日) 最 新 的 3.0.1 版 本 。 
请 从 以 下 网 站 下 载 Python3.0.1 的 源 代码 。 
http://python.org/downloads/ 
Python 由 约 60 万 行 的 源 代码 构成 ， 大 体 分 类 如 下 。 


表 10.1 源 代码 分 布 


源 代码 行 数 
296 215 





271 109 
9 565 











大 家 可 以 看 到 ，Python 和 C 语言 几乎 各 占 一 半 。 库 基本 上 是 用 Python 写 的 ，Python 的 
核心 部 分 基本 上 是 用 C 语言 写 的 。 
我 们 将 源 代 码 整齐 地 按照 目录 进行 了 分 割 ， 这 些 目录 及 其 概要 如 下 所 示 。 


表 10.2 目录 结构 





Demo 采用 了 Python 的 演示 应 用 程序 
Doc 文档 
Grammer Python 的 语法 文件 











Include 编译 Python 时 引用 的 各 种 头 文件 





Lib 标准 附加 库 

















Mac Mac 用 的 工具 等 














Misc 很 多 文件 的 集合 (如 gdbinit 和 vimrc 等 ) 





Modules Python 的 C 语 言 扩 展 模 块 





Objects Python 的 对 象 用 的 C 语 言 代码 





PC 依存 于 0S 等 环境 的 程序 





PCbuild 构造 Win32 和 x64 时 使 用 





Parser Python 用 的 解析 器 





Python Python 的 核心 





其 中 与 Python 的 垃圾 回收 相关 的 目录 有 “Python”“Modules”“Include” 以 及 “Objects”。 



































@ 原创 的 Python 解释 器 : 通常 提起 Python， 指 的 就 是 用 C 语 言 实现 的 CPython， 其 他 还 有 用 Java 实 现 的 Jython， 











在 .NET 上 实现 的 IronPython 等 。 
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10.1.3 _ Python 的 垃圾 回收 算法 


Python 在 垃圾 回收 中 采用 了 引用 计数 法 。 关 于 引用 计数 的 算法 我 们 已 经 在 第 3 章 中 解说 
过 了 ， 如 果 各 位 有 不 明白 的 地 方 ， 请 参考 该 章 。 


由 玖 届 对 象 管理 


接 下 来 我 们 要 实际 引用 Python 的 源 代码 ， 对 垃圾 回收 进行 解读 。 
首先 我 们 来 一 起 看 看 Python 中 处 理 的 对 象 类 型 事实 上 是 怎样 的 结构 吧 。 


对 象 的 结构 


Python 中 将 与 “列表 ”“ 元 组 ”等 内 置 数据 类 型 对 应 的 结构 体 在 内 部 进行 定义 ， 其 中 的 一 
部 分 如 表 10.3 所 示 。 


表 10.3 ”结构 体 和 内 置 数据 类 型 的 对 应 
对 应 的 内 置 数 据 类 型 
PyListObject 列表 型 
PyTupleObject 元 组 型 








PyDictObject 字典 型 
PyFloatObject 浮 点 型 
PyLongObject 长 整 型 














那么 让 我 们 来 详细 地 看 看 表 10.3 中 的 浮 点 型 和 元 组 型 吧 。 注 释 我 们 就 省 略 了 。 


Include/floatobject.h 
/* 学 点 型 */ 
14 | typedef struct { 
15 PyObject_HEAD 
16 double ob_fval; 
17 | } PyFloatObject; 


这 里 我 们 想 请 大 家 注意 一 下 与 垃圾 回收 相关 的 成 员 。Python 的 垃圾 回收 采用 的 是 引用 计 
数 法 的 方式 。 也 就 是 说 ， 应 该 有 保持 计数 器 的 成 员 。 
第 15 行 的 宏 Py0bject_HEAD 定义 如 下 。 


Include/object.h 
78 | #define PyObject_HEAD Py0Object ob_base; 


10.2 ”对 象 管理 





根据 宏 定义 了 Py0bject 型 的 成 员 ob_base。 


Include/tupleobject.h 

/* 元 组 */ 

24 | typedef struct { 

25 Py0bject_VAR_HEAD 

26 PyObject *ob_item[1]; 


32 | } PyTupleObject; 
33 





此 外 ， 元 组 这 边 第 25 行 的 宏 Py0bject_VAR_HEAD 的 定义 如 下 。 


Include/object.h 
93 | #define PyO0bject_VAR_HEAD PyVar0bject ob_base; 


107 | typedef struct { 

108 PyObject ob_base; 

109 Py_ssize_t ob_size; /* 保持 元 素数 量 */ 
110 | } PyVarObject; 








看 上 去 好 像 是 根据 宏 定 义 了 PyVarD0bject 型 的 成 员 ob_base, 实际 上 还 是 定义 了 
PyObject 结构 体 。 
下 面 我 们 来 看 看 Py0bject 的 内 容 。 


Include/object.h 
101 | typedef struct _object { 


102 _PyObject_HEAD_EXTRA 
103 Py_ssize_t ob_refcnt; 
104 struct _typeobject *ob_type; 


105 | } PyObject; 


这 里 面 的 ob_refcnt 成 员 负 责 维持 引用 计数 。 
像 这 样 ， 所 有 的 内 置 型 结构 体 都 在 开头 保留 了 Py0bject 结构 体 。 





1 


PyFloatObject PyTupleObject PyListObject 


PyObject 


PyObject PyObject 


double ob_fval Py_ssize_t ob _ Size; 
PyObject *ob item[1]; 


Py_ssize_t ob_size; 
PyObject **ob item; 
Py_ssize_t allocated; 





图 10.1 对 象 的 结构 
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顺便 提 一 句 ， PyO0bject 内 的 成 员 ob_type 负责 持 有 各 种 类 型 的 信息 ， 因 为 这 方面 跟 GC 
关系 不 大 ， 所 以 本 书 中 就 没有 特别 提 及 。 


由 下 届 Python 的 内 存 分 配器 


本 节 我 们 将 为 大 家 讲解 Python 分 配 内 存 的 方法 以 及 其 分 配 的 内 存 的 结构 。 
举 个 例子 ， 假 设 我 们 用 Python 脚本 来 实现 如 下 这 样 的 代码 。 


a=[] 
在 这 个 代码 内 部 执行 的 是 怎样 的 分 配 呢 ? 我 们 将 在 这 一 节 对 此 进行 说 明 。 
内 存 结构 


在 Python 中 ， 当 要 分 配 内 存 空 间 时 ， 不 单纯 使 用 malloc/free， 而 是 在 其 基础 上 堆放 3 个 
独立 的 分 层 ， 有 效率 地 进行 分 配 。 





对 象 特 有 的 内 存 分 配器 





Python 对 象 分 配器 





Python 低级 内 存 分 配器 








通用 的 基础 分 配器 (如 glibe 的 malloc 等 ) 





物理 内 存 交换 目的 地 ( 如 HDD 等 ) 





10.2 Python 分 配器 的 分 层 


第 0 层 往 下 是 0S 的 功能 。 第 -2 层 是 隐 含 和 机 器 的 物理 性 相关 联 的 部 分 ，0S 的 虚拟 内 
存 管理 器 负责 这 部 分 功能 。 第 -1 层 是 与 机 器 实际 进行 交互 的 部 分 ，0S 会 执行 这 部 分 功能 。 
因为 这 部 分 的 知识 已 经 超出 了 本 书 的 范围 ， 我 们 就 不 额外 加 以 说 明了 。 

在 第 3 层 到 第 0 层 调 用 了 一 些 具 有 代表 性 的 函数 ， 其 调用 图 如 下 。 这 里 我 们 以 字典 对 象 
的 生成 为 例 。 








10.4 第 0 层 通用 的 基础 分 配器 











PyDict_New() = 一 .3 层 
PyObject_GC_New() 一 一 2 层 
PyObject_Malloc() 一 一 2 层 
new_arena() 一 一 1 层 
malloc() 一 一 0 层 


关于 各 个 函数 的 具体 内 容 我 们 会 在 后 面 为 大 家 讲述 ， 所 以 这 里 大 家 只 要 大 致 了 解 一 下 流 
程 就 够 了 。 
下 面 我 们 就 从 第 0 层 开始 讲解 。 


【让 全 第 0 层 通用 的 基础 分 配器 


以 Linux 为 例 ， 第 0 层 指 的 就 是 glibc 的 malloc() 这 样 的 分 配 右 ， 是 对 Linux 等 0S 申 
请 内 存 的 部 分 。 

Python 中 并 不 是 在 生成 所 有 对 象 时 都 调用 malloc() ， 而 是 根据 要 分 配 的 内 存 大 小 来 改 
变 分 配 的 方法 。 申 请 的 内 存 大 小 如 果 大 于 256 字 节 ， 就 老实 地 调用 malloc(); 如 果 小 于 等 
于 256 字 节 ， 就 要 轮 到 第 1 层 和 第 2 层 出 场 了 。 

实际 的 源 代 码 如 下 所 示 。 





























Objects/obmalloc.c 


723 | void * 

724 | PyObject_Malloc(size_t nbytes) 
725°| { 

726 block *bp; 

727 poolp pool; 

728 poolp next; 

729 uint size; 

730 


/* 这 部 分 为 异常 处 理 ， 略 去 */ 





743 if ((nbytes - 1) < SMALL_REQUEST_THRESHOLD) { 














/* 当 申 请 的 内 存 大 小 小 于 等 于 256 字 节 时 的 内 存 分 配 (第 1 层 和 第 2 层 ) */ 











901 直 





/* 当 申 请 的 内 存 大 小 大 于 256 字 节 时 的 内 存 分 配 (第 0 层 ) */ 
913 return (void *)malloc(nbytes); 
914 |} 
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程序 会 把 想 分 配 的 对 象 大 小 传递 给 Pyobject_Malloc() 函数 。if 语句 的 条 件 ， 即 
SMALL_REQUEST_THRESHOLD 宏 的 定义 如 下 所 示 。 


Objects/obmalloc.c 
134 | #define SMALL_REQUEST_THRESHOLD 256 

















可 见 所 申请 的 内 存 大 小 大 于 256 字 节 时 调用 的 是 malloc() 。 


有: 齐 第 1 层 Python 低级 内 存 分 配器 


Python 中 使 用 的 对 象 基 本 上 都 小 于 等 于 256 字 节 ， 并 且 净 是 一 些 马上 就 会 被 废弃 的 对 象 。 
请 看 下 面 的 例子 。 





for x in range(100) : 


print (x) 





上 述 Python 脚本 是 把 从 0 到 99 的 非 负 整数 ”转化 成 字符 串 并 输出 的 程序 。 这 个 程序 会 
大 量 使 用 一 次 性 的 小 字符 串 。 

在 这 种 情况 下 ， 如 果 逐 次 查询 第 0 层 的 分 配 带 ,就 会 发 生 频繁 调用 malloc() 和 free() 
的 情况 ， 这 样 一 来 效率 就 会 降低 。 

因此 ， 在 分 配 非 常 小 的 对 象 时 ，Python 内 部 会 采用 特殊 的 人 处理。 实际 执行 这 项 处 理 的 就 
是 第 1 层 和 第 2 层 的 内 存 分 配 需 。 

当 需 要 分 配 小 于 等 于 256 字 节 的 对 象 时 ， 就 利用 第 1 层 的 内 存 分 配器 。 在 这 一 层 会 事先 
从 第 0 层 开始 迅速 保留 内 存 空间 ， 将 其 蕾 积 起 来 。 第 1 层 的 作用 就 是 管理 这 部 分 蓄积 的 空间 。 


10.5.1 ”内 存 结 构 


我 们 来 看 看 第 1 层 中 所 处 理 的 信息 的 内 存 结构 吧 。 

根据 所 管理 的 内 存 空间 的 作用 和 大 小 的 不 同 ， 它 们 各 自 的 叫 法 也 不 相同 。 我 们 称 最 小 
的 单位 为 block， 最 终 返 回 给 申请 者 的 就 是 这 个 block 的 地 址 。 比 block 大 的 单位 的 是 pool， 
pool 内 部 包含 block。 pool 再 往 上 叫 作 arena。 


















































Jg 非 负 整 数 : 指 大 于 等 于 0 的 整数 。 
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图 10.3 arena、pool、block 三 者 的 关系 














也 就 是 说 arena > pool > block， 感 觉 很 像 俄罗斯 套 娃 吧 。 

为 了 避免 频繁 调用 malloc() 和 free()， 第 0 层 的 分 配器 会 以 最 大 的 单位 arena 来 保留 
内 存 。pool 是 用 于 有 效 管理 空 的 block 的 单位 。 

arena 这 个 词 有 “竞技 场 ” 的 意思 。 大 家 可 以 理解 成 竞技 场 里 有 很 多 个 pool，pool 里 面 漂 
浮 着 很 多 个 block ， 这 样 或 许 更 容易 理解 一 些 。 











10.5.2 ”arena 
下 面 我 们 先 从 arena 开始 说 明 。 


Objects/obmalloc.c 


250 | struct arena_object { 


/* malloc 后 的 arena 的 地 址 


























256 uptr address; 
257 
258 /* 将 arena 的 地 址 用 于 给 pool 使 用 而 对 齐 的 地 址 */ 
259 block* pool_address; 
260 

/* 此 arena 中 空闲 的 poo1 数 量 */ 
264 uint nfreepools; 
265 
266 /* 此 arena 中 pool 的 总 数 */ 
267 uint ntotalpools; 
268 
269 /* 连接 空 闪 pool 的 单 向 链表 */ 
270 struct pool_header* freepools; 
271 

/* 稍 后 说 明 */ 
286 struct arena_object* nextarena; 
287 struct arena_object* prevarena; 


288 | }; 
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arena_object 结构 体 管 理 着 arena。 
arena_object 的 成 员 address 里 保存 的 是 使 用 第 0 层 内 存 分 配 需 分 配 的 arena 的 地 址 。 
arena 的 大 小 固定 为 256K 字 节 ， 大 小 用 以 下 宏 定义 。 











Objects/obmalloc.c 
172 | #define ARENA_SIZE (256 << 10) /* 256K 字 节 */ 





arena_object 的 成 员 pool_address Wg arena 里 开头 的 pool 的 地 址 。 不 过 这 里 
有 一 个 问题 ， 为 什么 除了 域 address 之 外 还 一 个 别 的 pool 地 址 呢 ? arena 的 地 址 和 开头 
的 pool 地 址 应 该 是 一 致 的 啊 ! 

事实 上 ， 有 时 候 arena 的 地 址 和 arena 内 开头 的 pool 的 地 址 会 有 所 不 同 。 至 于 其 原因 ， 
我 们 会 在 下 面 的 10.5.3 节 为 大 家 详细 说 明 。 

arena_object 还 承担 着 保持 被 分 配 的 pool 的 数量 、 将 空 pool 连接 到 单 向 链表 的 义务 。 

此 外 ，arena_object 还 被 数组 arenas 管理 。 











Objects/obmalloc.c 

472 | /* 将 arena_object 作 为 元 素 的 数组 */ 

473 | static struct arena_object# arenas = NULL; 
474 | /* arenas 的 元 素数 量 */ 


475 | static uint maxarenas = 0; 


arenas 





arena object 


有 


arena 


图 10.4 _ arenas 的 结构 





大 家 应 该 注意 到 了 吧 , 结构 体 arena_object 的 成 员 里 有 我 们 没 见 过 的 类 型 ， 就 是 
“uptr”“block”“uint”。 它 们 是 用 宏 定 义 的 别名 。 





Objects/obmalloc.c 
219 | #undef uchar 


220 | #define uchar unsigned char /* 约 8 位 */ 

221 

222 | #undef uint 

223 | #define uint unsigned int /* 约 大 于 等 于 16 位 */ 
224 


225 | #undef ulong 
226 | #define ulong unsigned long /* 约 大 于 等 于 32 位 */ 
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227 
228 | #undef uptr 
229 | #define uptr Py_uintptr_t 


232 | typedef uchar block; 






































uchar 和 uint 分 别 是 unsigned xxx 的 略称 。unsigned 指 的 是 “不 带 符号 ”的 意思 ， 只 有 
在 处 理 非 负 整 数 时 才 会 被 用 到 。 

那么 我 们 来 着 重 谈 一 下 这 其 中 的 Py_uintptr 七 吧 。 这 个 类 型 是 整数 型 的 一 个 别名 ， 用 
来 存放 指针 。 其 定义 根据 编译 环境 的 不 同 会 略 有 差异 ， 不 过 一 般 定 义 如 下 。 








Include/pyport.h 


78 | typedef uintptr_t Py_uintptr_t; 





uintptr 七 是 由 从 C99 开始 导入 的 stdint.h 提供 的 ,在 将 C 指针 转化 成 整数 时 ， 它 起 
着 很 大 的 作用 。 

C 指针 大 小 根据 环境 而 变化 。 举 个 例子 ， 当 CPU 是 32 位 的 时 候 ， 指 针 ( 几 乎 ) 都 是 4 字 节 
的 ， 当 CPU 是 64 位 时 ， 指 针 则 是 8 字 节 的 。 我 们 在 32 位 PC 上 将 指针 转化 成 int 没什么 问题 ， 
但 是 在 64 位 PC 上 将 指针 转化 成 int 就 会 造成 溢出 。 

uintptr_t 正 是 负责 填补 这 种 环境 差异 的 。uintptr_t 会 根据 环境 变换 成 4 字 节 或 8 字 节 ， 
将 指针 安全 地 转化 ， 避 免 发 生 洪 出 的 问题 。 



































int 的 情况 uintptr t 的 情况 
指针 指针 


int uintptr t 


32 位 CPU : 





64 位 CPU : | 
10.5 ”将 指针 转换 为 整数 时 的 uintptr_t 
10.5.3 ool 





arena 内 部 各 个 pool 的 大 小 固定 在 4 区 字 节 。 因 为 几乎 对 所 有 0S 而 言 ， 其 虚拟 内 存 的 页 
面 大 小 都 是 4K 字 节 ， 所 以 我 们 也 相应 地 把 pool 的 大 小 设 定 为 4K 字 节 。 
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Objects/obmalloc.c 
147 | #define SYSTEM_PAGE_SIZE (4 * 1024) 


182 | #define POOL_SIZE SYSTEM_PAGE_SIZE /* must be 2°N */ 








大 多 数 0S 都 是 以 页 面 为 单位 来 管理 内 存 的 。 把 页 面 大 小 和 pool 大 小 设 定 成 相同 的 值 ， 
我 们 就 能 让 0S 以 pool 为 单位 来 管理 内 存 。 

arena 内 的 pool 被 划分 为 4K 字 节 的 大 小 ,不 过 划分 时 需要 下 一 番 功 夫 ， 就 是 要 把 pool 
开头 的 地 址 按照 4K 字 节 的 倍数 进行 对 齐 。 也 就 是 说 ， 每 个 pool 开头 的 地 址 为 4 字 节 (2 的 
12 次 方 ) 的 倍数 。 前 一 节 中 我 们 曾经 提 到 过 ，arena 的 地 址 和 arena 内 开头 pool 的 地 址 是 不 
一 致 的 ， 原 因 就 在 pool 地 址 的 对 齐 。 


























arena 


pool pool pool pool pool pool 
(4K 字 站 |4K 字 门 (4K 字 节 )| “|(4K 字 节 )|(4K 字 节 )K4K 字 节 ) 











0xb7e65000 Oxb7ea4000 
4K 字 节 对 齐 4 区 字 节 对 齐 
0xb7e64008 0xb7ea4008 


10.6 ”pool 的 对 齐 


在 从 pool 搜索 block 的 时 候 ， 上 面 这 一 番 功 夫 能 起 到 非常 大 的 作用 。 关 于 这 点 我 们 将 在 
10.6.20 节 为 大 家 说 明 。 

接 下 来 我 们 为 大 家 介绍 的 是 管理 pool 的 结构 体 。 

关于 各 个 成 员 我 们 会 在 之 后 进行 说 明 ， 这 里 大 家 只 要 知道 有 这 种 东西 就 够 了 。 








Objects/obmalloc.c 








235 | struct pool_header { 

/* 分 配 到 pool 里 的 block 的 数量 */ 
236 union { block *_padding; 
237 uint count; } ref; 

/* block 的 空闲 链表 的 开头 */ 
238 block *freeblock; 

/* 指向 下 一 个 pool 的 指针 (双向 链表 ) */ 
239 struct pool_header *nextpool; 

/* 指向 前 一 个 pool 的 指针 (双向 链表 ) */ 
240 struct pool_header *prevpool; 

/* 自己 所 属 的 arena 的 索引 (对 于 arenas 而 言 ) */ 
241 uint arenaindex; 

/* 分 配 的 block 的 大 小 */ 
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242 uintb ‘a21idx. 
/* 到 下 一 个 block 的 偏 移 */ 
243 uint nextoffset; 
/* 到 能 分 配 下 一 个 block 之 前 的 偏 移 */ 
244 uint maxnextoffset; 
245 | }; 


结构 体 pool_header 就 跟 它 的 名 字 一 样 ， 必 须 安排 在 各 个 pool 天 头 。 pool_header 在 
arena 内 将 各 个 pool 相连 接 ， 保 持 pool 内 的 block 的 大 小 和 个 数 。 


10.5.4 new_arenal() 


以 之 前 的 内 容 为 前 提 ， 下 面 让 我 们 来 实际 阅读 一 下 生成 arena 的 代码 吧 。 
生成 arena 的 代码 是 用 new_arena() 国 数 写 的 , 所 以 我 们 先 来 粗略 地 看 一 下 new_ 
arena() 函数 的 整体 结构 。 





Objects/obmalloc.c:new_arenal() 
































508 | static struct arena_object* 
509 | new_arena(void) 
510|{ 
511 struct arena_object* arenaobj; 
518 if (unused_arena_objects == NULL) { 
/* 生成 arena_object */ 
/* 把 生成 的 arena_object 补充 到 arenas 和 unused_arena_objects 里 
*/ 
558 3 
/* 把 arena 分 配给 未 使 用 的 arena_object */ 
/* 把 arena 内 部 分 割 成 pool */ 
594 return arenaobj; /* 返回 新 的 arena_object */ 
595 | ] 








因为 new_arena() 函数 是 超过 100 行 的 大 函数 ， 所 以 我 们 一 部 分 一 部 分 地 来 讲 。 


Objects/obmalloc.c:new_arenal() 


508 | static struct arena_object* 
509 | new_arena(void) 
510|{ 
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511 struct arena_object* arenaobj ; 

512 uint excess; 

513 

518 if (unused_arena_objects == NULL) { 

















在 这 里 出 现 的 unused_arena_objects 是 什么 呢 ? 


Objects/obmalloc.c 


480 | static struct arena_object* unused_arena_objects = NULL; 





unused_arena_objects 指 的 是 现在 未 使 用 的 arena_object 的 单 向 链表 。unused_arena_ 
objects 中 含有 新 生成 的 arena_object 和 已 经 使 用 过 的 、 已 废弃 的 arena_object。 

因为 这 个 链表 的 初始 值 是 NULL， 所 以 当 没 有 可 以 使 用 的 arena 时 ，if 语句 为 真 。 

下 面 我 们 就 来 看 看 这 个 if 语句 的 内 容 吧 。 




















Objects/obmalloc.c:new_arenal() 





518 if (unused_arena_objects == NULL) { 

519 i 主 

520 uint numarenas; 

521 size_t nbytes; 

522 

526 numarenas = maxarenas ?了 maxarenas << 1 : INITIAL ARENA_OBJECTS; 
527 if (numarenas <= maxarenas) 

528 return NULL; /* 洲 出 */ 


在 这 里 决定 新 分 配 的 arena 的 数量 。 

maxarenas 表示 的 是 arenas (所 有 的 arena 的 数组 ) 现 在 的 元 素数 量 。 当 然 ， 刚 开始 调用 
new_arena() 的 时 候 一 个 arena_object 都 没有 ， 所 以 maxarenas 也 是 0。 

此 外 ， 这 时 候 numarenas 会 被 设置 成 INITIAL_ARENA_0BJECTS。 








Objects/obmalloc.c 


490 | /* 首先 分 配 的 arena_object 的 数量 */ 
491 | #define INITIAL_ARENA_OBJECTS 16 


除 此 之 外 的 情况 下 numarenas 会 被 设置 为 maxarenas 的 2 倍 。 如 果 结 果 (numarenas ) 发 
生 溢 出 ， 程 序 就 断定 不 能 再 增加 arena 了 ， 于 是 在 第 528 行 返回 NULL。 

















Objects/obmalloc.c 





533 nbytes = numarenas * sizeof(*arenas); 
/* 在 第 1 个 参数 为 NULL 时 ，realloc 与 malloc 相同 */ 
534 arenaobj = (struct arena_object *)realloc(arenas, nbytes); 


535 if (arenaobj == NULL) 
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536 return NULL ; 
537 arenas = arenaobj; 
538 


之 后 保留 所 设 定 数量 的 arena_object， 将 其 存 人 静态 全 局 变量 arenas (所 有 arena 的 数 
组 ) 中 。 这 部 分 realloc() 函数 的 调用 是 第 0 层 的 分 配 带 的 调用 。 





Objects/obmalloc.c:new_arenal() 























548 /* unused_arena_objects 生成 列表 */ 
549 for (i = maxarenas; i < numarenas; ++i) { 
/* 标记 尚未 分 配 arena */ 
550 arenas[i] .address = 0; 
/* 只 在 末尾 存 人 NULL， 除 此 之 外 都 指向 下 一 个 指针 */ 
551 arenas[i] .nextarena = i < numarenas - 1 ? 
552 &arenas[i+1] : NULL; 
553 3} 
554 
555 /* 反映 到 全 局 变量 中 */ 
556 unused_arena_objects = &arenas [maxarenas] ; 
557 maxarenas = numarenas; 
558 } 








我 们 把 新 分 配 的 arena_object 作为 “未 被 使 用 的 arena_object” 连接 到 一 个 链表 。 这 
时 arena_object 结构 体 的 成 员 nextarena 是 作为 单 向 链表 使 用 的 。 

除 此 之 外 ,我 们 同时 把 0 加 入 arena_object 的 成 员 address 中 。 成 员 address 里 通常 
包含 指向 arena 的 指针 ， 不 过 在 arena_object 不 持 有 arena 的 时 候 ， 将 其 明确 设置 为 0， 使 
用 arena 未 被 保留 的 标志 。 

最 终 我 们 将 用 单 向 链表 连接 的 arena_object 开头 的 指针 存 人 unused_arena_objects 中 。 

另外 ， 我 们 把 更 新 后 的 数组 arenas 内 的 arena_object 的 数量 存 人 maxarenas 里 。 




















maxarenas numarenas - Maxarenas 
TT 
2 村 杞 杞 村 


unused arena object 








arenas 

















图 10.7 连接 到 unused_arena_objects 





半 我 们 就 完成 了 数组 arenas 的 初始 化 。 接 下 来 我 们 必须 保留 其 重要 内 容 





[Es 
了 


arenao 
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Objects/obmalloc.c:new_arenal() 


562 
563 


565 
566 
567 
570 
571 
572 
573 








/* 取出 未 被 使 用 的 arena_object */ 
arenaobj = unused_arena_objects; 


unused_arena_objects = arenaobj->nextarena; /* 取出 */ 


/* 分 配 arena( 256K 字 节 ) */ 
arenaobj->address = (uptr)malloc(ARENA_SIZE); 
if (arenaobj->address == 0) { 
/* 分 配 失败 */ 
arenaobj->nextarena = unused_arena_objects; 
unused_arena_objects = arenaobj; 


return NULL ; 


我 们 从 unused_arena_objects 中 取出 一 个 未 被 使 用 的 arena_object， 为 其 分 配给 arena。 
如 果 arena 分 配 失败 ， 就 将 取出 的 arena_object 再 次 连接 到 unused_arena_objects, 
返回 NULL。 也 就 是 说 , 在 这 个 函数 的 调用 方 ， 必须 和 malloc() 函数 一 样 对 返回 值 进行 
NULL 检查 ， 一旦 失败 就 必须 采用 适当 的 对 策 来 处 理 。 

接 下 来 我 们 将 分 配 到 的 arena 内 部 分 割 为 pool。 

















Objects/obmalloc.c:new_arenal() 


581 
582 
583 
584 
585 


587 
588 
589 
590 
591 
592 
593 
594 
595 





3 


arenaobj->freepools = NULL; 
/* pool_address <- 对 齐 后 开头 pool 的 地 址 

nfreepools <- 对 齐 后 arena 中 pool 的 数量 */ 
arenaobj->pool_address = (block*)arenaobj->address; 
arenaobj->nfreepools = ARENA_SIZE / POOL_SIZE; 


excess = (uint) (arenaobj->address & POOL_SIZE_MASK) ; 
if (excess != 0) { 

--arenaobj->nfreepools; 

arenaobj->pool_address += POOL_SIZE - excess; 
} 


arenaobj->ntotalpools = arenaobj->nfreepools; 


return arenaobj; 


结构 体 arena_object 的 成 员 pool_address 中 存 有 以 4K 字 节 对 齐 的 pool 的 地 址 。 

在 此 使 用 P00L_SIZE_MASK 来 对 用 malloc() 保留 的 arena 的 地 址 进行 屏蔽 处 理 ， 计 算 超 
过 的 量 (excess )。 
如 果 超 过 的 量 (excess) 为 0， 因为 arena 的 地 址 刚好 是 4K 字 节 (2 的 12 次 方 ) 的 倍数 ， 
所 以 程序 会 原样 返回 分 配 的 arena_object。 这 时 候 因为 arena 内 已 经 被 pool 填 满 了 ， 所 以 








10.5 














可 以 通过 计算 
如 果 超 过 的 量 不 为 0, 程序 就 会 
pool_address。 此 时 arena 内 前 后 加 起 来 会 产生 一 
设置 为 nfreepoolso 








pool address 


pool 
(4K 字 节 ) 


| 


超过 的 量 


arena 





(excess) 


图 10.8 





这 样 我 们 就 成 功 生成 了 


一 个 arena。 


10.5.5 
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arena 的 大 小 或 pool 的 大 小 来 求 出 arena 内 pool 的 数量 。 
计算 “arena 的 地 址 十 超过 的 量 ”, 将 


其 设置 为 成 员 


个 pool 的 空白 ， 所 以 要 减 去 这 部 分 ,将 其 


pool 
(4K 字 节 ) 


| 


pool 数 
少 一 个 


设置 pool_address 以 及 调整 pool 数量 


usable _ arenas 和 unused arena objects 





我 们 再 详细 讲 一 下 





管理 arena 的 全 局 变量 usable_arenas 和 unused_arena _objects 吧 。 大 


家 还 记得 unused_arena_objects 在 new_arena() 函数 中 出 现 过 吧 。 


因为 这 些 源 代码 中 已 经 有 详细 的 注释 ， 所 以 我 们 就 直接 将 寺 


Objects/obmalloc.c 





unused_arena_objects 








将 现在 未 被 使 用 的 arena | ecti 
(可 以 说 arena 还 未 得 到 保留 

arena_object pn 内 列表 的 开头 取 的 。 
此 外 , 在 Py0bject_Free() 时 arena 为 








连接 到 单 向 链表 。 








空 的 情况 下 , arena_object 会 


其 翻译 过 来 了 。 


被 追加 到 这 个 列表 的 开头 。 





注意 : 只 有 当 结 构 体 arena_object 的 成 员 address 为 0 时 ， 才 将 其 存 人 这 个 列表 。 


usable_arenas 





这 是 持 有 arena 的 arena_object 的 双向 链表 ， 其 中 arena 分 配 了 可 利用 的 pool。 






































这 个 pool 正 在 等 待 被 再 次 使 用 ， 或 者 还 未 被 使 用 过 。 
这 个 链表 按照 block 数 量 最 多 的 arena 的 顺序 排列 。 
(基于 成 员 nfreepools 升序 排列 ) 
这 意味 着 下 次 分 配 会 从 使 用 得 最 多 的 arena 开始 取 。 

然后 它 也 会 给 很 多 将 几乎 为 空 的 arena 返 回 系 统 的 机 会 。 
根据 我 的 测试 ， 这 项 改善 能 够 在 很 大 程度 上 释放 arena。 
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在 没有 能 用 的 arena 时 ,我 们 使 用 unused_arena_objects。 如 果 在 分 配 时 没有 arena， 
就 从 这 个 链表 中 取出 一 个 arena_object， 分 配 新 的 arena。 

在 没有 能 用 的 pool 时 ， 则 使 用 usable_arenaso 如 果 在 分 配 时 没有 pool, 就 从 这 个 链表 
中 取出 arena_object， 从 分 配 到 的 arena 里 取出 一 个 pool。 

usable_arenas 是 通过 arena_object 的 成 员 nfreepools 排序 的 链表 。 从 Python2.5 开始 改 
善 了 这 一 点 。 

这 里 有 一 点 需要 注意 ， 那 就 是 unused_arena_objects 是 单 问 链表 ，usable_arenas 是 双 问 链表 。 
当 我 们 采用 unused_arena_objects 时 ， 只 能 使 用 结构 体 arena_object 的 成 员 nextarena; 而 当 我 们 
采用 usable_arenas 时 ， 则 可 以 使 用 成 员 nextarena 和 成 员 prevarena。 

arena_object 的 nextarena 和 prevarena 在 不 同情 况 下 用 法 是 不 同 的 ， 请 大 家 记 住 这 
一 点 


Ye 






























































10.5.6 ”第 1 层 总 结 
第 1 层 分 配 融 的 任务 就 是 生成 arena 和 pool， 将 其 存 和 人 arenas 里 ,或 者 连接 到 unused_ 


arena_objects。 
第 1 层 的 任务 可 以 用 一 句 话 来 总 结 ， 那 就 是 “管理 arena”。 
本 节 中 我 们 也 涉及 了 block， 不 过 实际 分 配 block 的 是 第 2 层 。 


上 玉 负 第 2 层 Python 对 象 分 配器 


第 2 层 的 分 配器 负责 管理 pool 内 的 block。 
这 一 层 实 际 上 是 将 block 的 开头 地 址 返回 给 申请 者 ， 并 释放 block 等 。 
那么 我 们 来 看 看 这 一 层 是 如 何 管理 block 的 吧 。 


















































10.6.1 block 


pool 被 分 割 成 一 个 个 的 block。 我 们 在 Python 中 生成 对 象 时 ， 最 终 都 会 被 分 配 这 个 block 
(在 要 求 大 小 不 大 于 256 字 节 的 情况 下 )。 

以 block 为 单位 来 划分 ， 这 是 从 pool 初始 化 时 就 决定 好 的 。 这 是 因为 我 们 一 开始 利用 
pool 的 时 候 就 决定 了 “这 是 供 8 字 节 的 block 使 用 的 pool”。 

我 们 将 每 个 block 的 大 小 定 为 8 的 倍数 ， 相 应 地 block 的 地 址 肯定 也 是 8 的 倍数 ， 这 理 
所 当然 ， 因 为 pool 是 按 4K 字 节 (2 的 12 次 方 ) 对 齐 的 。 

为 什么 要 将 block 按 8 的 倍数 对 齐 呢 ?这 是 因为 这 样 一 来 block 的 地 址 在 64 位 CPU 和 
32 位 CPU 中 都 不 会 出 现 问题 。 如 果 不 返 回 适 应 CPU 的 地 址 ， 那 么 在 有 些 环境 下 访问 时 就 可 
能 会 出 现 “ 非 法 对 齐 ”。 为 了 避免 这 一 问题 ， 所 以 才 按 8 字 节 来 对 齐 的 。 
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pool 
(8 字 节 ) 
在 pool 内 部 大 小 | block block | block a block | block | block 
是 固定 的 (8 字 节 ) | (8 字 节 )|(8 字 节 ) (8 字 节 ) | (8 字 节 ) | (8 字 节 ) 
| 
按 4K 字 节 对 齐 的 地 址 按 4K 字 节 对 齐 的 地 址 
pool 
(24 字 节 ) 
在 pool 内 部 大 小 block ee block 
是 固定 的 (24 字 节 ) (24 字 节 ) 
| | 
按 4K 字 节 对 齐 的 地 址 按 4K 字 节 对 齐 的 地 址 


10.9 对 齐 block 


申请 的 大 小 和 对 应 的 block 的 大 小 如 表 10.4 所 示 。 


表 10.4 ”申请 的 大 小 和 对 应 的 block 的 大 小 
申请 的 大 小 ( 字 节 ) 对 应 的 block 的 大 小 ( 字 节 ) 
1~8 
9~16 
17 ~ 24 
25 ~ 32 














241 ~ 248 
249 ~ 256 














利用 地 址 对 齐 的 hack 

malloc() 返回 的 地 址 事实 上 是 按照 一 定 大 小 对 齐 的 。 虽 然 根据 CPU 的 不 同 而 有 所 区 别 ， 不 
过 在 32 位 CPU 的 情况 下 ，glibc malloc 返回 的 是 以 8 字 节 对 齐 的 地 址 。 

这 跟 CPU 有 着 很 大 的 关系 。CPU 原则 上 能 从 对 齐 的 地 址 取出 数据 。 必 
的 地 址 也 应 配合 CPU 对 齐 来 返回 数据 。 

利用 这 一 点 的 著名 hack 就 是 将 地 址 的 低 3 位 用 作 标 志 。 

假设 在 结构 体内 存 入 某 个 指针 。 如 果 从 malloc() 返回 的 地 址 是 按 8 字 节 对 齐 的 ， 那 么 其 指针 
的 低 3 位 肯定 为 “0”。 于 是 我 们 想到 了 在 这 里 设置 位 ， 将 其 作为 标志 来 使 用 。 当 我 们 真 的 要 访问 
这 个 指针 时 ， 就 将 低 3 位 设 为 0， 无 视 标志 。 









































应 地 ，malloc() 分 配 
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这 是 一 个 非常 大 胆 的 hack， 但 事实 上 glibc malloc 却 实现 了 这 个 hack。 

大 家 可 以 从 下 面 的 网 站 获得 glibc 的 源 代码 。 

http:/www.gnu.org/softwareWipc/development.html 

如 果 大 家 去 仔细 研究 一 下 malloc.c 的 set_head() 函数 ， 就 能 发 现 一 些 很 有 趣 的 事情 。 有 兴 
趣 的 读者 不 妨 一 锅 究 竟 。 




















10.6.2 ”Usedpools 

Python 的 分 配器 采用 Best- fit 的 分 配 战略 ， 即 极力 让 分 配 的 block 的 大 小 接近 申请 的 大 小 。 
为 此 需要 在 一 开始 就 找到 有 合适 大 小 的 block 的 pool， 也 就 是 说 ，block 的 大 小 刚好 符合 要 分 
配 的 大 小 。 

这 里 需要 大 家 回忆 一 下 ,我 们 是 以 block 为 单位 划分 pool 的 ,也 就 是 说 ，pool 内 所 有 
block 的 大 小 都 相等 。 因 此 ， 要 想 找 到 与 所 申请 的 大 小 相对 应 的 block， 首 先 必须 找到 有 这 个 
block 的 pool。 

此 外 ， 搜 索 这 个 pool 的 过 程 必须 是 高 速 的 。 因 为 在 每 次 分 配 时 都 会 进行 这 项 搜索 处 理 ， 
所 以 如 果 这 里 的 性 能 不 佳 的 话 ， 就 会 大 幅 影响 应 用 程序 的 整体 性 能 。 

反 过 来 ， 当 我 们 找到 pool 后 , 不 管 大 小 如 何 ， 只 要 在 发 现 的 pool 内 找到 一 个 空 的 
block， 就 能 轻松 地 划分 block。 

那么 Python 中 为 了 实现 高 速 搜索 pool 都 下 了 什么 样 的 功夫 呢 ? 答案 就 在 于 usedpools 
这 个 全 局 变量 。 


usedpools 是 保持 pool 的 数组 ， 其 结构 如 图 10.10 所 示 。 









































usedpools 


pool 


pool 


pool 


i 














图 10.10 usedpools 的 结构 





时 





F 个 pool 用 双向 链表 相连 ， 形 成 了 一 个 双 问 循环 链表 。usedpools 里 存储 的 是 指向 开头 
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pool 的 指针 。 
usedpools 负责 从 众多 pool 中 找 出 那些 block 的 大 小 符合 要 求 的 pool， 并 将 其 高 速 返回 。 
因此 数组 usedpools 的 索引 及 pool 内 部 的 block 的 大 小 这 两 者 的 对 应 关系 如 下 。 


表 10.5 ”申请 的 大 小 和 索引 的 对 应 关系 
申请 的 大 小 ( 字 节 ) 对 应 的 block 的 大 小 ( 字 节 ) 














241 ~ 248 
249 ~ 256 




















也 就 是 说 ， 如 果 申 请 的 大 小 是 20 字 节 ， 我 们 就 参照 上 面 的 表 10.5 取出 索引 2 的 元 素 中 
的 pool， 那 么 这 个 pool 肯定 有 着 用 于 24 字 节 的 block。 
这 样 一 来 ， 我 们 就 能 以 0(1) 的 搜索 时 间 搜 索 符合 所 申请 大 小 的 pool 了。 





usedpools 


wom 
了 到 






























































































































































16 字 节 32 字 节 248 字 节 256 字 市 
用 的 pool 用 的 pool 用 的 pool 用 的 pool 
6 字 节 248 字 市 
用 的 pool 用 的 pool 
24 字 市 
的 pool 
L4 





图 10.11 与 usedpools 的 索引 相对 应 的 pool 








这 里 需要 大 家 注意 的 是 ， 这 个 usedpools 内 的 pool 链表 是 用 双向 链表 连接 的 。 事实 上 ， 
一 且 pool 内 部 的 所 有 block 都 被 释放 ， 它 就 会 被 作为 一 个 “ 空 pool” 返回 给 arena。 我 们 并 
不 知道 是 哪个 pool 释放 的 block。 因 此 这 就 增加 了 从 usedpools 中 的 pool 链表 的 中 途 释 放 
block 的 可 能 : 
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usedpools 


正在 分 配 的 
pool 














usedpools 


宇 pool 。 











图 10.12 ”取出 空 pool 


正在 分 配 的 
pool 


正在 分 配 的 
pool 


被 取出 


| | 
5 
衬 pool 


在 这 种 情况 下 , 我 们 就 必须 从 链表 中 途 取 出 pool。 而 之 所 以 采用 双向 链表 来 连接 
usedpools 的 元 素 ， 就 是 因为 从 结构 上 来 说 ， 双 向 链表 更 擅长 处 理 元 素 的 取出 和 插入 。 


10.6.3 ”复杂 的 usedpools 


要 把 usedpools 讲 完 并 没有 那么 简单 ， 再 来 看 一 下 usedpools 的 初始 化 部 分 ， 其 代码 是 





非常 复杂 的 。 


Objects/obmalloc.c 


412 
413 
414 
415 
416 
417 
418 
419 
420 
421 
422 
423 
424 
425 
426 
427 
428 
429 
430 
431 
432 





static poolp usedpools[2 * ((NB_SMALL_SIZE_CLASSES + 7) / 8) * 8] = 
PT(0), PT(1), PT(2), PT(3), PT(4), PT(5), PT(6), PT(7) 


#if 


#if 


#if 


#if 


#if 


#if 


#if 


NB_SMALL_SIZE_CLASSES > 8 


x PTC8), PT(9), PTCLO)., 下 了 (7 PT(12), PTCL3) PT(14); PT(15) 


NB_SMALL_SIZE_CLASSES > 16 


= ETCL6), PT(L7), PT(L8Yy :PT(C19)y PT(20), PTC212 PT(22)., PT(23) 


NB_SMALL_SIZE_CLASSES > 24 
， PT(24), PT(25), PT(26), PT(27), 
NB_SMALL_SIZE_CLASSES > 32 
(29 了 PIC332， PT(34), PT(38), 
NB_SMALL_SIZE_CLASSES > 40 
，PT(40) ，PT(41) ，PT(42) ，PT(43) ， 
NB_SMALL_SIZE_CLASSES > 48 
，PT(48) ，PT(49) ，PT(50) ，PT(51) ， 
NB_SMALL_SIZE_CLASSES > 56 
x .PT(B6); PT(57), PT(S8), PT(B9), 





#endif /* NB_SMALL_SIZE_CLASSES > 56 


#endif /* NB_SMALL_SIZE_CLASSES > 
#endif /* NB_SMALL_SIZE_CLASSES > 
#endif /* NB_SMALL_SIZE_CLASSES > 32 
#endif /* NB_SMALL_SIZE_CLASSES > 


48 
40 


24 








PT(28) PT(29), PT(30), PT(31) 
PT(36), PT(37), PT(38), PT(39) 
PT(44), PT(45), PT(46), PT(47) 
PT(52), PT(53), PT(54), PT(55) 
PT(60) PT(61), PT(62), PT(63) 

*/ 

*/ 

*/ 

*/ 


*/ 





{ 
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433 #endif /* NB_SMALL_SIZE_CLASSES > 16 */ 
434 #endif /* NB_SMALL SIZE_CLASSES > 8 */ 
435 |}; 








大 家 完全 不 知道 这 是 在 干什么 吧 。 首 先 我 们 要 理解 usedpools 是 什么 数组 。 


Objects/obmalloc.c 


247 | typedef struct pool_header *poolp; 











poolp 大 概 是 pool_header 的 指针 型 的 别名 。 也 就 是 说 ， usedpools 是 pool_header 的 指针 
型 的 数组 。 
接 下 来 我 们 来 看 看 宏 NB_SMALL_SIZE_CLASSES 的 内 容 。 


Objects/obmalloc.c 
115 | #define ALIGNMENT 8 /* 有 必要 为 2 的 NHN 次 方 */ 





134 | #define SMALL_REQUEST_THRESHOLD 256 
135 | #define NB_SMALL_SIZE_CLASSES (SMALL_REQUEST_THRESHOLD / ALIGNMENT) 











NB_SMALL_SIZE_CLASSES 是 “256 / 对 齐 的 字 节 数 "。256 指 的 是 256 字 节 ,也 就 是 第 1 
层 和 第 2 层 分 配器 可 接受 的 字 节 数 的 上 限 。 也 就 是 说 ， 在 这 个 计算 中 我 们 求 出 的 是 block 的 
大 小 有 多 少 种 。 只 要 不 更 改 对 齐 的 字 节 数 ， 这 个 宏 的 计算 结果 就 是 32。 

在 此 基础 上 删 去 不 需要 的 宏 ， 如 下 所 示 。 














Objects/obmalloc.c 简略 版 
static poolp usedpools[64] = { 
PT(0), PT(1), PT(2), PT(3), PT(4), PT(5), PT(6), PT(7) 
s PT(8), PI(9), PTC(10), PT(L1), PT(12)y PT(13), PT(14), PT(15) 
， PT(16), PT(17), PT(18), PT(19), PT(20), PT(21), PT(22), PT(23) 
» PT(24), PT(25), PT(26), PT(27),; PT(28), PT(29), PT(30),; PT(31) 
}; 





这 样 就 清楚 多 了 吧 。 

看 来 usedpools 的 元 素数 量 是 64， 但 申请 大 小 的 种 类 却 只 有 32 种 ， 为 什么 呈 倍 数 关系 呢 ? 
事实 上 为 了 用 双向 链表 连接 pool, usedpools 的 元 素 是 分 成 两 两 一 组 的 ， 因 此 所 分 配 的 数组 
的 元 素数 量 才 会 是 32 的 倍数 64。 


























已 
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usedpools 


两 个 一 组 
1 




















图 10.13 usedpools 的 分 组 索引 


下 面 我 们 来 看 看 宏 PT() 的 内 容 ， 这 个 宏 被 定义 在 usedpools 的 元 素 内 部 。 


Objects/obmalloc.c 
410 | #define PT(x) ~ PTA(x), PTA(x) 
宏 PTO 以 两 个 一 组 的 形式 调用 宏 PTA()。 
下 面 我 们 来 看 看 被 调用 的 宏 PTA()。 





Objects/obmalloc.c 


409 | #define PTA(x) ((poolp )((uchar *)&(usedpools[2*(x)]) - 2*sizeof (block *))) 





这 个 宏 定义 了 一 个 指针 ， 这 个 指针 指向 的 位 置 是 从 一 组 的 开头 再 往 
型 的 大 小 ”。 








前 “两 个 block 指针 





问题 是 我 们 为 什么 非 要 把 事情 搞 得 这 么 复杂 呢 ? 请 大 家 回忆 一 下 ，usedpools 是 结构 体 


pool_header 的 数组 。 


Objects/obmalloc.c 重新 执行 


235 | struct pool_header { 

236 union { block *_padding; 

237 uint count; } ref; 

238 block *freeblock; 

239 struct pool_header *nextpool; 
240 struct pool_header *prevpool; 
241 uint arenaindex; 

242 uint szidx; 

243 uint nextoffset; 

244 uint maxnextoffset; 

245 | }; 
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这 里 双向 链表 的 成 员 是 nextpool 和 prevpool。 

往 前 移动 两 个 block 指针 型 的 大 小 ， 就 是 往 前 移动 第 236 行 、 第 237 行 的 成 员 ref 和 第 
238 行 的 成 员 freeblock 的 大 小 。 为 了 这 次 处 理 ， 我 们 将 成 员 ref 定义 为 union 的 block 指 
针 型 的 成 员 _padding。 成 员 _padding 实际 上 没有 被 使 用 。 

在 此 基础 上 就 可 以 像 下 面 这 样 使 用 usedpools 了 。 








byte = 20 /* 申请 的 字 节 数 */ 





byte = (20 - 1) >> 3 /* 对 齐 : 结果 2 */ 


pool = usedpools [byte+byte] /* 因为 是 两 两 一 组 ， 所 以 索引 加 倍 : index 4 */ 


这 时 ， 取 出 的 pool 存在 如 下 关系 。 


pool; == pool->nextpool 
pool; == pool->prevpool 
Pool->nextpool == pool->prevpool 
usedpools pool_header 结构 体 








t 


(2) 可 以 获取 索引 0 的 “|block * padding; 
地 址 
vi be 二 位 
(访问 这 里 block *freeblock; (3) nextpool 对 应 索引 2 
对 已 
struct pool header *nextpool; prevpool 对 应 索引 3 























struct pool header *prevpool; 





图 10.14 usedpools 的 初始 化 





“这 代码 真是 太 复 杂 了 ， 何 必 这 么 费劲 ， 只 要 把 usedpools 拿 来 当 结 构 体 pool_header 的 数 
组 不 就 完了 吗 ?” 读 到 这 里 的 时 候 ， 笔 者 曾 这 样 想 到 。 但 是 这 段 代 码 是 有 着 历史 背景 的 ， 当 
笔者 看 到 源 代码 中 的 下 面 这 条 注释 时 ， 不 禁 大 吃 一 惊 。 
































usedpools 的 安装 不 知 为 何如 此 复杂 。 


这 话说 得 也 太 痛 快 了 吧 。 
不 过 之 后 作者 倒是 清楚 地 写 出 了 原因 ， 这 样 一 来 笔者 其 着 的 心 也 就 落地 了 。 



































在 需要 缓存 的 时 候 ， 能 够 尽 可 能 地 让 缓存 少 承 载 一 些 引 用 表 。 
(只 需要 pool_header 中 两 个 内 部 的 指针 成 员 ) 








原来 如 此 。 如 果 直 接 保留 pool_header 的 话 ， 往 往 就 会 出 现 usedpools 变 得 太 大 ， 绥 
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存 承载 不 下 的 状况 。 因 为 我 们 要 频繁 引用 数组 usedpools, 所 以 让 它 小 一 些 才 会 减轻 组 
存 的 压力 。 

此 外 ， 因 为 我 们 只 使 用 pool_header 内 双向 链表 的 成 员 ， 所 以 会 浪费 掉 除 此 之 外 的 部 分 。 
作者 应 该 是 想 要 在 这 上 面 下 点 功夫 ， 看 看 能 不 能 用 两 个 成 员 就 解决 问题 ， 所 以 才 想 出 了 这 么 
复杂 的 方法 吧 。 


10.6.4 block 的 状态 管理 


pool 内 被 block 完全 填 满 了 ， 那 么 pool 是 怎么 进行 block 的 状态 管理 的 呢 ? 
block 只 有 以 下 三 种 状态 。 











1. 已 经 分 配 
2. 使 用 完毕 
3. 未 使 用 




















使 用 完毕 的 block 指 的 是 使 用 过 一 次 、 已 经 被 释放 的 block。 未 使 用 的 block 指 的 是 一 次 
都 没 被 使 用 过 的 block。 

当 mutator 申请 分 配 block 时 ，pool 必须 迅速 地 把 使 用 完毕 或 未 使 用 的 block 传递 过 去 。 
为 此 ，pool 中 分 别 用 不 同 的 方法 来 管理 使 用 完毕 的 block 和 未 使 用 的 block。 

首先 是 使 用 完毕 的 block 的 管理 。 

所 有 使 用 完毕 的 block 都 会 被 连接 到 一 个 叫 作 freeblock 的 空闲 链表 进行 管理 。block 
是 在 释放 的 时 候 被 连接 到 空闲 链表 的 。 因 为 使 用 完毕 的 block 肯定 经 过 了 使 用 一 释放 的 流程 ， 
所 以 释放 时 空闲 链表 开头 的 地 址 就 会 被 直接 写 入 作为 释放 对 象 的 block 内 。 之 后 我 们 将 释放 
完毕 的 block 的 地 址 存 人 freeblock 中 。 这 个 freeblock 是 由 pool_header 定义 的 。 我 们 将 
freeblock 放 在 开头 ， 形 成 block 的 空闲 链表 。 

大 家 可 能 会 想 说 :“ 往 block 内 部 写 人 是 不 是 不 太 好 呢 ? ”不 过 这 个 block 是 作为 释放 对 象 
的 block， 写 入 什么 都 是 OK 的 。 反 过 来 ， 因 为 原则 上 分 配 申 请 者 (用 户 ) 有 权利 改写 已 经 分 
配 的 block， 所 以 我 们 不 能 随便 往 里 面 写 入 。 

下 面 该 说 未 使 用 的 block 了 。 因 为 它 没有 经 过 释放 处理， 所 以 不 能 像 使 用 完毕 的 block 
那样 用 链表 来 连接 。 当 然 我 们 可 以 用 循环 让 block 形成 空 闪 链表， 但 不 管 怎样 ， 分 配 部 分 重 
要 的 是 速度 ， 我 们 不 能 写 这 么 楞 的 代码 。 

因此 我 们 决定 通过 从 pool 开头 的 偏 移 量 来 对 其 进行 管理 。pool_header 的 成 员 nextoffset 中 
保留 着 偏 移 量 。 
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将 使 用 完毕 的 block 
用 空闲 链表 连接 






























































使 用 完毕 的 国定 本 放生 代用 完毕 的 .| | 使 用 完毕 的 | 未 使 用 的 | 未 使 用 的 
block block block block block block 


未 使 用 的 block 保留 偏 移 量 





图 10.15 ” pool 的 block 管 理 




















据 此 我 们 分 配 的 未 使 用 的 block 是 连续 的 block。 因 为 分 配 时 是 从 pool 的 开头 开始 分 配 
block 的 ， 所 以 其 中 不 会 出 现 使 用 完毕 的 block 和 已 经 分 配 的 block。 因 此 我 们 只 要 将 偏 移 量 
偏 移 到 下 一 个 block， 就 知道 它 确实 是 未 使 用 的 block 了 。 





10.6.5 PyObject _ Malloc() 


至 此 关于 usedpools 的 内 容 就 介绍 完了 ， 现 在 让 我 们 来 看 看 实际 分 配 block 的 操作 吧 。 

我 们 使 用 在 介绍 第 0 层 时 提 到 的 Pyobject_Malloc() 函数 来 分 配 block。Python 中 使 用 
的 绝 大 部 分 对 象 都 是 用 这 个 Py0bject_Malloc() 函数 来 分 配 的 。 这 个 函数 有 三 个 作用 ,分 
别 是 “分 配 block”“ 分 配 pool” 以 及 “分 配 arena”。 
Py0bject_Malloc() 因数 也 跟 new_arena() 一 样 ， 是 一 个 长 达 200 行 的 大 函数 。 下 面 我 
们 将 其 拆 开 来 看 。 

函数 的 整体 样子 如 下 所 示 。 



































Objects/obmalloc.c:PyObject_Malloc() 
723 | void* 

724 | PyObject_Malloc(size_t nbytes) 
725 | +{ 





/* 是 否 小 于 等 于 256 字 节 ? */ 
743 if ((nbytes - 1) < SMALL_REQUEST_THRESHOLD) { 





/* (A) 从 usedpools 中 取出 pool */ 
750 if (pool != pool->nextpool) { 


/* (B) 返回 pool 内 的 block */ 














781 水 
782 /* 是 否 存 在 可 以 使 用 的 arena? */ 
786 if (usable_arenas == NULL) { 








/* (C) 调用 new_arena() */ 











801 
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803 
804 /* 从 arena 取 出 使 用 完毕 的 pool */ 
805 pool = usable_arenas->freepools; 
/* 是 否 存在 使 用 完毕 的 poo1? */ 
806 if (pool != NULL) { 
/* (D) 初始 化 使 用 完毕 的 pool */ 
/* (E) 初始 化 pool 并 返回 block */ 
874 } 
899 
/* (F) 初始 化 空 pool */ 
/* (E) 初始 化 pool 并 返回 block */ 
901 } 
905 | redirect: 
/* 当 大 于 等 于 256 字 节 时 ， 按 一 般 情 况 调用 malloc */ 
913 return (void *)malloc(nbytes); 
914|} 





10.6.6 (人 A) 从 usedpools 中 取出 pool 


Objects/obmalloc.c:PyObject_Malloc(): ( A ) 从 usedpools 中 取出 pool 





723 | void * 

724 | PyObject_Malloc(size_t nbytes) 

725 | { 

743 if ((nbytes - 1) < SMALL_REQUEST_THRESHOLD) { 
744 LOCK() ; /* 线程 锁 */ 

745 

746 

747 /* 变换 成 索引 */ 

748 size = (uint) (nbytes - 1) >> ALIGNMENT_SHIFT; 
749 pool = usedpools[size + size]; /* 取出 pool */ 
750 if (pool != pool->nextpool) { 


在 第 748 行将 申请 的 字 节 数 变换 成 usedpools 的 指定 索引 。 申 请 的 字 节 数 除 以 对 齐 值 就 
是 索引 。 因 此 ， 宏 ALIGNMENT_SHIFT 的 定义 如 下 所 示 。 
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Objects/obmalloc.c 


115 | #define ALIGNMENT 8 
116 | #define ALIGNMENT_SHIFT 3 





在 Py0bject_Malloc() 的 第 750 行 调查 pool 是 否 已 经 连接 到 了 索引 指定 的 usedpools 的 元 
素 。 如 果 已 经 连接 到 了 ，pool 和 pool->nextpool 的 地 址 应 该 会 不 同 。 


10.6.7 ( B ) 返 回 pool 内 的 block 
当 pool 被 分 配 完毕 时 ， 我 们 就 要 进入 “(B) 返 回 pool 内 的 block” 这 一 处 理 阶段 了 。 


Objects/obmalloc.c:PyObject_Malloc(): ( B ) 返 回 pool 内 的 block 


























750 if (pool != pool->nextpool) { 

/* pool 内 分 配 的 block 的 数量 */ 
755 ++pool->ref .count; 
756 bp = pool->freeblock; 

/* 通过 空闲 链表 取出 block( 使 用 完毕 的 block ) */ 
758 if ((pool->freeblock = *(block **)bp) != NULL) { 
759 UNLOCK() ; /* 解除 线程 锁 */ 
760 return (void *)bp; 
761 上 
762 

/* 通过 偏 移 量 取 出 block( 未 使 用 的 block) */ 
765 if (pool->nextoffset <= pool->maxnextoffset) { 
767 pool->freeblock = (block*)pool + 
768 pool->nextoffset; 

/* 设 定 到 下 一 个 空 block 的 偏 移 量 */ 

769 pool->nextoffset += INDEX2SIZE(size); 
770 *(block **) (pool->freeblock) = NULL; 
771 UNLOCK (); 
72 return (void *)bp; 
773 } 
774 /* 没有 能 分 配 到 pool 内 的 block 了 */ 
775 next = pool->nextpool; 
776 pool = pool->prevpool; 
777 next->prevpool = pool; 
X78 pool->nextpool = next; 
779 UNLOCK(); 
780 return (void *)bp; 
784 } 

















我 们 已 经 讲 过 如 何 从 空闲 链表 取出 block (使 用 完毕 的 block) 以 及 如 何 通过 偏 移 量 取出 
block (未 使 用 的 block ) 了 。 首 先 我 们 来 尝试 从 空闲 链表 中 取出 block。 
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当 block 内 的 链表 (下 一 个 空 block 的 地 址 ) 为 NULL 时 ， 通 过 偏 移 量 取出 block。 
第 769 行 的 宏 INDEX2SIZE() 的 定义 如 下 所 示 。 


Objects/obmalloc.c 
120 | #define INDEX2SIZE(I) (((uint)(I) + 1) << ALIGNMENT_SHIFT) 


可 见 我 们 只 ‘要 把 索引 改 为 block 的 大 小 ( 字 节 数 ) 就行 了 。 
到 了 第 775 行 到 第 778 行 这 里 ，pool 内 就 没有 能 分 配 的 block 了 。 这 时 我 们 把 pool 从 其 
所 在 的 usedpools 中 移 除 。 
10.6.8 (CC ) 调 用 new_arenal() 


接 下 来 我 们 将 介绍 在 调用 Py0bject_ Me 函数 时 没有 空 block 的 情况 下 该 如 何 处 理 。 
首先 我 们 来 一 起 看 看 “(C ) 调 用 new_arena()” 这 部 分 吧 。 


Objects/obmalloc.c:PyObject_Malloc(): ( C ) 调 用 new_arenal() 


786 if (usable_arenas == NULL) { 

787 /* 分 配 新 的 arena_object */ 

794 usable_arenas = new_arena(); 

795 if (usable_arenas == NULL) { 

796 UNLOCK (); 

797 goto redirect ; 

798 } 

799 usable_arenas->nextarena = 

800 usable_arenas->prevarena = NULL; 
801 





当 没 有 可 用 的 arena 时 ， 就 调用 new_arena() 困 数 ， 将 新 的 arena _object 设置 到 usable_ 
arenas 中 。 如 果 new_arena() 函数 失败 ， 就 跳 到 redirect 标签 调用 malloc()。 

因为 我 们 设置 的 usable_arenas 前 后 都 没有 连 着 arena_object， 所 以 要 把 双向 链表 的 两 个 方 
问 都 设 定 为 NILL。 也 就 是 说 ，usable_arenas 中 只 设置 了 一 个 这 里 分 配 的 arena_object。 


10.6.9 (DD ) 初 始 化 使 用 完毕 的 pool 
下 面 我 们 来 看 看 “(D ) 初始 化 使 用 完毕 的 pool ”这 部 分 吧 。 


ee c:PyObject_Malloc(): ( D ) 初 始 化 使 用 完毕 的 pool 








804 * 取出 arena 内 使 用 完毕 的 pool */ 

805 ee = usable_arenas->freepools; 

806 if (pool != NULL) { 

807 /* 把 使 用 完毕 的 pool 从 链表 中 取出 */ 








808 usable_arenas->freepools = pool->nextpool; 


816 
817 
818 


825 
826 
827 
829 
830 
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/* 从 arena 内 可 用 的 poo1 数 中 减 去 一 个 */ 
--usable_arenas->nfreepools; 
if (usable_arenas->nfreepools == 0) { 
/* 设 定 下 一 个 arena */ 
usable_arenas = usable_arenas->nextarena; 
if (usable_arenas != NULL) { 


usable_arenas->prevarena = NULL; 


} 





usable_arenas 是 一 个 将 可 用 的 arena_object 排序 完毕 的 双向 链表 。 第 805 行 和 第 806 行 负 
责 检查 这 个 usable_arenas 开头 的 arena_object 的 成 员 freepools 里 还 有 没有 空 的 pool。 

如 果 有 使 用 完毕 的 pool， 就 在 成 员 freepools 里 设置 下 一 个 使 用 完毕 的 pool。 

在 之 后 的 第 818 行 到 第 829 行 ，arena 里 面 已 经 没有 可 用 的 pool 了 ， 这 时 我 们 将 下 一 个 
arena_object 设置 到 usable_arenas 里 。 因 为 我 们 设置 的 usable_arenas 位 于 链表 的 开头 ， 
所 以 不 存在 更 靠 前 的 链表 。 因 此 我 们 在 第 827 行将 成 员 prevarena 设 为 NULL。 


10.6.10 (EE ) 初 始 化 pool 并 返回 block 
下 面 我 们 来 看 一 下 “(E ) 初始 化 pool 并 返回 block” 这 部 分 。 


Objects/obmalloc.c:PyObject_Malloc(): ( E ) 初 始 化 pool 并 返回 block 


842 
843 
844 
845 
846 
847 
848 
849 
850 


855 


856 
857 
858 
859 


865 
866 





init_pool: 


/* 连接 到 usedpools 的 开头 */ 
next = usedpools[size + size]; /* == prev */ 
Pool->nextpool = next; 
Pool->prevpool = next; 
next->nextpool = pool; 
next->prevpool = pool; 
pool->ref.count = 1; 
if (pool->szidx == size) { 
/* 比较 申请 的 大 小 和 pool 中 国定 的 block 大 小 ， 
/* 如 果 大 小 一 样 ， 那 么 不 初始 化 也 无 所 谓 
*/ 
bp = pool->freeblock; 
/* 设 定 下 一 个 空 block 的 地 址 */ 
pool->freeblock = *(block **)bp; 
UNLOCK() ; 


return (void *)bp; 























pool->szidx = size; 
size = INDEX2SIZE(size); 
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867 bp = (block *)pool + POOL_OVERHEAD ; 

868 pool->nextoffset = POOL_OVERHEAD + (size << 1); 
869 pool->maxnextoffset = POOL_SIZE - size; 

870 pool->freeblock = bp + size; 

871 *(block **) (pool->freeblock) = NULL; 

872 UNLOCK(); 

873 return (void *)bp; 

874 } 




















通过 第 844 行 到 第 848 行 的 操作 ， 把 从 arena 取出 的 pool 插入 到 usedpools 的 开头 。 

在 第 849 行将 pool_header 的 成 员 ref .count 设 为 1。 这 个 计数 器 表示 的 是 pool 内 已 经 
分 配 的 block 的 数量 。 接 下 来 因为 要 分 配 一 个 bloek， 所 以 用 1 来 初始 化 。 

然后 检查 pool 内 固定 的 block 大 小 和 申请 的 block 大 小 是 否 相 同 。 这 项 检查 只 对 曾经 使 
用 过 一 次 的 pool 有 效 。 对 于 新 使 用 的 pool， 因 为 还 没有 为 其 设 定 固定 的 block 大 小 ， 所 以 这 
项 检查 不 会 为 真 。 如 果 这 项 检查 为 真 ， 就 要 从 pool 取出 block 的 地 址 并 将 其 返回 。 

如 果 这 项 检查 为 假 ， 就 初始 化 pool。 进 行 这 项 操作 的 是 第 865 行 到 第 871 行 的 代码 。 
为 这 部 分 比较 难 理解 ， 所 以 让 我 们 结合 图 来 看 。 
































使 用 完毕 的 pool 
无 需 初始 化 处 理 (8 字 人 站) 


block | block | block 
(8 字 节 ) | (8 字 节 ) | (8 字 节 ) 





















block block | block 
(8 字 节 ) | (8 字 节 ) | (8 字 节 ) 


block 已 经 划分 完毕 

















与 申请 的 大 小 相同 
申请 的 大 小 























使 用 完毕 的 pool 
外 最 (16 字 节 ) 


py \ 
block 
(16 字 节 ) 


10.16 ”pool 的 初始 化 判断 









block .., block block 
(16 字 节 ) (16 字 节 ) (16 字 节 ) 


block 已 经 划分 完毕 

















与 申请 的 大 小 不 同 











在 第 867 行 出 现 的 宏 P00L_O0VERHEAD 是 结构 体 pool_header 的 大 小 。 


Objects/obmalloc.c 


291 | #define ROUNDUP(x) (((x) + ALIGNMENT_MASK) & ”ALIGNMENT_MASK) 
292 | #define POOL_OVERHEAD ROUNDUP (sizeof (struct pool_header)) 
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10.6.11_(F ) 初 始 化 空 pool 
最 后 我 们 来 看 看 “F ) 初始 化 空 pool” 这 部 分 吧 。 


Objects/obmalloc.c:PyObject_Malloc(: ( F ) 初始 化 空 pool 


879 


882 


884 
885 
886 
887 
888 
892 
893 
894 
895 
897 
898 
899 
900 
901 





} 


pool = (poolp)usable_arenas->pool_address; 
/* 设 定 arena_object 的 位 置 */ 
pool->arenaindex = usable_arenas - arenas; 
/* 输入 一 个 虚拟 的 大 值 */ 

pool->szidx = DUMMY_SIZE_IDX; 
usable_arenas->pool_address += POOL._SIZE; 


--usable_arenas->nfreepools; 


if (usable_arenas->nfreepools == 0) { 
/* 如 果 没 有 可 用 的 pool1， 就 设 定 下 一 个 arena */ 
usable_arenas = usable_arenas->nextarena; 
if (usable_arenas != NULL) { 


usable_arenas->prevarena = NULL; 














3 











goto init_pool; /* (E) 初始 化 pool 并 返回 block */ 








在 此 有 一 处 需要 重点 跟 大 家 讲解 一 下 ， 就 是 如 何 使 用 宏 DUMMY_SIZE_IDX。 


Objects/obmalloc.c 


294 | #define DUMMY_SIZE_IDX Oxffff 


为 了 不 跟 申请 的 block 大 小 重复 ,我 们 将 新 pool 的 成 员 szindx 设 成 一 个 大 的 虚拟 值 。 
这 样 就 可 以 使 用 goto 语句 跳 转 到 init_pool， 在 初始 化 pool 的 时 候 ， 确实 将 大 小 和 偏 移 量 





初始 化 。 








这 上 


# 我 们 也 就 讲 完了 长 长 的 Py0bject_Malloc() 函数 。 


10.6.12 PyObject_Freel() 
保留 的 内 存 空间 必须 释放 掉 。 通 过 接 下 来 要 讲 的 Py0bject_Free() 函数 就 可 以 释放 用 
Py0bject_Malloc() 函数 保留 的 内 存 空间 。 
这 个 函数 有 三 个 作用 ， 分 别 是 “释放 block”“ 释 放 pool” 以 及 “释放 arena”。 
下 面 我 们 就 来 看 看 这 个 Py0bject_Free() 函数 吧 。 
Py0bject_Free() 也 是 一 个 非常 大 的 函数 。 这 部 分 的 函数 都 很 大 ， 确 实 比较 难 理解 。 
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Objects/obmalloc.c:PyObject_Free() 



































919 | void 
920 | PyO0bject_Free(void *p) 
921 | 
929 
930 pool = POOL_ADDR(p); 
931 if (Py_ADDRESS_IN_RANGE(p，pool)) { 
933 BOCK(C): 
941 /* (A) 把 作为 释放 对 象 的 block 连接 到 freeblock */ 
/* 这 个 pool 中 最 后 free 的 block 是 否 为 NULL? */ 
943 if (lastfree) { 
949 /* pool 中 有 已 经 分 配 的 block */ 
950 if (--pool->ref.count != 0) { 
951 /* 不 执行 任何 操作 */ 
952 UNLOCK() ; 
953 return; 
954 3 
/* (B) 将 pool 返 回 arena */ 
/* 当 arena 内 所 有 pool 为 空 时 */ 
985 if (nf == ao->ntotalpools) { 
/* (C) 释放 arena */ 
return; 
1025 + 
/* arena 还 和 独 一 个 空 pool */ 
1026 if (nf == 1) { 
/* (D) 移动 到 usable_arenas 的 开头 */ 
return; 
1041 本 
/* (E) 对 usable_arenas 进行 排序 */ 
1102 return; 
11083 } 
/* (F) 捅 人 pool */ 
于 二 return; 
1122 } 
1123 
1124 /* (G) 释放 其 他 空间 */ 
1125 free(p) ; 
1126 | } 





10.6 第 2 层 Python 对象 分 配器 


10.6.13 ( A ) 把 作为 释放 对 象 的 block 连接 到 freeblock 


Objects/obmalloc.c:PyObject_Free(): ( A ) 把 作为 释放 对 象 的 block 连接 到 freeblock 


919 
920 
924 
922 
923 
924 
925 
926 
927 
928 
929 
930 
931 


933 


941 


942 





void 


PyObject_Free(void *p) 








a 

poolp pool; 

block *lastfree; 

poolp next, prev; 

uint size; 

/* 为 NULL 时 不 执行 任何 操作 */ 

if (p == NULL) 
return; 

pool = POOL_ADDR (Pp); 

if (Py_ADDRESS_IN_RANGE(p, poo1)) { 
LOCK() ; 
/* 从 pool 中 取出 freeblock */ 
*(block **)p = lastfree = pool->freeblock; 
/* 将 释放 的 block 连 接 到 freeblock 的 开头 */ 
pool->freeblock = (block *)p; 





首先 使 用 宏 P00L_ADDR()， 从 作为 释放 对 象 的 地 址 取出 其 所 属 的 pool1。 关 于 宏 P00L_ 
ADDR() ， 因 为 在 细节 上 用 到 了 一 些 有 趣 的 技巧 ， 所 以 我 们 会 特别 拿 出 一 节 来 为 大 家 说 明 ， 请 
参考 10.6.20 节 。 

第 931 行 的 宏 Py_ADDRESS_IN_RANGE() 负责 检查 用 宏 P00L_ADDR() 获得 的 pool 是 否 正确 。 

如 果 通 过 检查 ， 就 从 pool 取出 freeblock， 设 其 为 作为 释放 对 象 的 block。 之 前 我 们 在 
10.6.4 节 中 所 说 的 将 使 用 完毕 的 block 连接 到 空闲 链表 指 的 就 是 这 项 处 理 。 

之 后 ， 设 作为 释放 对 象 的 block 的 地 址 为 pool 的 freeblock。 


10.6.14 ( B ) 将 pool 返 回 arena 





















































下 面 是 “(B ) 将 pool 返回 arena” 这 部 分 。 


Objects/obmalloc.c:PyObject_Free():(B ) 将 pool 返 回 arena 


943 
944 
945 
946 


if (lastfree) { 
struct arena_object* ao; 


uint nf; /* ao->nfreepools */ 
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949 /* pool 里 有 已 经 分 配 的 block */ 
950 if (--pool->ref.count != 0) { 
951 /* pool 正 在 被 使 用 */ 

952 UNLOCK (); 

953 return; 

954 上 


/* prev <-> pool <-> next */ 


/* prev <--> next */ 








960 next = pool->nextpool; 
961 prev = pool->prevpool; 
962 next->prevpool = prev; 
963 prev->nextpool = next; 
964 
/* 将 pool 返 回 arena */ 
968 ao = &arenas[pool->arenaindex]; 
969 pool->nextpool = ao->freepools; 
970 ao->freepools = pool; 
971 nf = ++tao->nfreepools; 

















第 943 行 中 的 局 部 变量 lastfree 里 放 的 是 前 一 个 的 freeblock。 当 这 里 不 为 NULL 时 ， 
我 们 就 执行 这 个 if 语句 中 的 命令 。 

在 第 950 行 检查 pool 里 是 否 有 已 经 分 配 的 block， 如 果 有 的 话 ， 就 不 执行 任何 操作 ， 直 
接 return。 

如 果 pool 内 没有 已 经 分 配 的 block， 那 么 这 个 pool 就 完全 没有 被 使 用 ， 这 时 就 必须 将 其 
连接 到 arena 的 freepools。 通 过 第 960 行 到 第 963 行 的 处 理 将 对 象 的 pool 从 usedpools 中 
取出 ， 然 后 在 第 968 行 到 第 971 行将 pool 返回 arena。 


10.6.15 (CC ) 释 放 arena 











Objects/obmalloc.c:PyObject_Free(: ( C ) 释 放 arena 


985 if (nf == ao->ntotalpools) { 
/* 从 usable_arenas 取 出 arena_object */ 
996 if (ao->prevarena == NULL) { 
997 usable_arenas = ao->nextarena; 
1000 = 
1001 else { 
1003 ao->prevarena->nextarena = 
1004 ao->nextarena; 
1005 于 
1006 





1007 
1009 
1010 
4011 
1012 
1013 
1014 


1015 
1016 
1017 
1018 
1019 


1020 
102: 
1022 
1023 
1024 
1025 
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if (ao->nextarena != NULL) { 
ao->nextarena->prevarena = 


ao->prevarena 和 














/* 为 了 再 利用 arena_object 
* 连接 到 unused_arena_objects 
*/ 


ao->nextarena = unused_arena_objects; 





unused_arena_objects = ao; 


/* 释放 arena */ 

free((void *)ao->address); 
/*“arena 尚 未 被 分 配 ” 的 标记 */ 
ao->address = 0; 


--narenas_currently_allocated; 


UNLOCK() ; 


return; 


当 arena 内 全 是 空 pool 的 时 候 ， 这 个 arena 就 完全 没有 被 使 用 了 ， 所 以 将 其 释放 。 

在 第 996 行 到 第 1011 行 ,从 usable_arenas( 可 用 的 arena 链 表 ) 取 出 对 象 arena_ 
object， 在 第 1015 行将 其 连接 到 unused_arena_objects (未 使 用 的 arena 链表 )。 

之 后 释放 arena。 在 释放 arena 后 ， 为 了 识别 “arena 尚未 被 分 配 ,将 arena_object 的 
成 员 address 设 为 0。 


10.6.16 (DD ) 移 动 到 usable_arenas 的 开头 





Objects/obmalloc.c:PyObject_Free(): ( D ) 移 动 到 usable_arenas 的 开头 


1026 


1032 
1033 
1034 
1035 
1036 
1038 
1039 
1040 
1041 





/* arena 只 有 一 个 空 pool */ 
if (nf == 1) { 
/* 连接 到 usable_arenas 的 开头 */ 


ao->nextarena = usable_arenas; 





ao->prevarena = NULL; 
if (usable_arenas) 
usable_arenas->prevarena = ao; 


usable_arenas = ao; 


UNLOCK() ; 


return; 
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下 一 个 条 件 是 “arena 只 有 一 个 空 pool ”的 情况 。 

这 一 个 空 pool 指 的 就 是 “B) 将 pool 返回 arena” 这 部 分 返回 的 pool。 也 就 是 说 ， 直 到 调 
用 这 次 的 Py0bject_Free() 函数 为 止 ， 这 个 arena 中 所 有 的 pool 都 是 正在 被 使 用 的 状态 。 

因为 所 有 的 pool 都 正在 被 使 用 ， 所 以 arena_object 本 来 就 没有 连接 到 usable_arenas， 需 
要 重新 插入 。 执 行 这 项 操作 的 是 第 1032 行 到 第 1036 行 的 代码 。 














10.6.17 (EE ) 对 usable_arenas 进行 排序 
终于 到 尾声 了 ， 我 们 来 看 看 “(E ) 对 usable_arenas 进行 排序 ”这 部 分 处 理 吧 。 


Objects/obmalloc.c:PyObject_Free(): ( E ) 对 usable_arenas 进 行 排序 


1049 if (ao->nextarena == NULL | 

1050 nf <= ao->nextarena->nfreepools) { 
1051 /* 不 执行 任何 操作 */ 

1052 UNLOCK() ; 

1053 return; 

1054 BB 

1060 if (ao->prevarena != NULL) { 

1061 /* ao isn't at the head of the list */ 
1063 ao->prevarena->nextarena = ao->nextarena; 
1064 } 

1065 else { 

1066 /* ao is at the head of the list */ 
1068 usable_arenas = ao->nextarena; 

1069 } 

1070 ao->nextarena->prevarena = ao->prevarena; 
4071 

1075 while (ao->nextarena != NULL && 

1076 nf > ao->nextarena->nfreepools) { 
1077 ao->prevarena = ao->nextarena; 

1078 ao->nextarena = ao->nextarena->nextarena; 
1079 中 

1080 

1086 ao->prevarena->nextarena = ao; 

1087 if (ao->nextarena != NULL) 

1088 ao->nextarena->prevarena = ao; 

1089 

2 二 UNLOCK() ; 

1102 return; 

1103 } 
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在 第 1049 行将 刚 返 回 pool 的 arena_object 的 空 pool 数 和 下 一 个 arena_object 的 空 
pool 数 进行 比较 。 如 果 之 前 的 arena_object 比 下 一 个 arena_object 小 ， 那么 就 不 执行 任 
何 操作 ， 直 接 return。 

如 果 并 非 如 此 ， 则 必须 对 usable_arenas 进行 排序 ， 按 arena 内 空 pool 的 数量 从 小 到 大 
的 顺序 进行 排列 。 

第 1060 行 到 第 1071 行 负 责 从 usable_arenas 取出 对 象 arena_object。 

然后 在 第 1075 行 到 第 1079 行 找到 下 一 个 插入 位 置 ， 进 行 插入 操作 。 





usable arenas 








空 pool 数 空 pool 数 空 pool 数 
3 7 10 


插入 





10.17 对 usable_arenas 进行 插入 





F 面 就 到 了 这 个 函数 最 后 的 部 分 了 ， 即 “FT) 插 入 pool”。 


10.6.18 (FF ) 插 入 pool 


Objects/obmalloc.c:PyObject_Free(): ( F ) 插 入 pool 





1110 --pool->ref .count; 

1112 size = pool->szidx; 

Lt3 next = usedpools[size + Size] ; 
1114 prev = next->prevpool; 

1115 /* 在 usedpools 的 开头 插入 : prev <-> pool <-> next */ 
1116 Pool->nextpool = next; 

1117 Pool->prevpool = preyv; 

1118 next->prevpool = pool; 

1119 prev->nextpool = pool; 

1120 UNLOCK (); 

上 二 宇 return; 

11422 3 

1123 

1124 /* We didn't allocate this address. */ 
1125 free(p) ; 

1126 | } 























请 大 家 回忆 一 下 ， 我 们 走 到 这 一 步 的 前 提 条 件 是 变量 lastfree 为 NULL。 也 就 是 说 ， 在 
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执行 这 次 释放 block 的 操作 之 前 ， 这 个 pool 内 的 block 都 已 经 被 分 配 完 

将 这 样 的 pool 从 usedpools 中 取出 ， 再 次 将 这 个 pool 插入 usedpools 

这 就 是 第 1112 行 到 第 1119 行 代码 所 进行 的 处 理 。 

这 样 我 们 就 讲 完了 Py0bject_Free() 函数 。 后 半 部 分 几乎 全 在 讲 arena 的 管理 ， 这 部 分 
虽然 由 第 1 层 分 配 带 负责 ， 不 过 从 方便 讲解 的 角度 ， 我 们 就 在 此 一 起 为 大 家 说 明了 。 


10.6.19 arena 和 pool 的 释放 策略 

在 Py0bject_Free() 函数 中 我 们 用 到 了 几 个 小 技巧 ， 其 中 的 一 个 就 是 “优先 使 用 被 利用 
最 多 的 内 存 空间 ”。 
举 个 例子 ， 大 家 请 回忆 一 下 之 前 的 10.6.18 节 的 内 容 。 

在 插入 pool 的 过 程 中 ， 当 从 usedpools 取出 的 pool (pool 内 的 所 有 block 都 已 经 分 配 ) 通 
过 释放 block 的 操作 返回 usedpools 时 ， 这 个 pool 已 经 被 插入 了 usedpools 的 元 素 内 的 开头 。 

大 家 明白 了 吧 ， 这 就 是 “优先 使 用 被 利用 最 多 的 pool”。 

Lbs 将 usable_arenas 按照 空 pool 的 数量 进行 排序 ， 也 是 “优先 使 用 被 利用 最 多 的 

那么 这 人 么 做 给 性 能 带 来 了 何 种 改善 呢 ? 

首先 ,“ 优 先 使 用 被 利用 最 多 的 内 存 空间 ” 指 的 是 优先 使 用 可 用 空间 少 的 内 存 空间 。 这 
样 一 来 ， 可 用 空间 多 的 内 存 空 间 ( 没 怎么 用 过 的 内 存 空间 ) 肯 定 会 被 排 到 后 面 。 

像 这 样 ， 通 过 尽量 不 使 用 那些 可 用 空间 多 的 内 存 空间 ， 增 加 了 使 其 完全 变 为 空 的 机 会 。 
如 果 这 部 分 内 存 空间 完全 为 空 ， 那 么 就 能 将 其 释放 。 

这 可 以 说 是 促使 内 存 空 间 释 放 的 策略 。 


10.6.20 ”从 block 搜 索 pool 的 技巧 
下 面 我 们 来 讲 一 下 之 前 提 到 的 宏 P00L_ADDR()。 
首先 是 宏 P00L_ADDR() 的 定义 。 这 个 宏 负 责 从 block 的 指针 搜索 该 block 所 属 的 pool 并 
返回 。 




























































































Objects/obmalloc.c 
147 | #define SYSTEM_PAGE_SIZE (4 * 1024) 
148 | #define SYSTEM_PAGE_SIZE_MASK (SYSTEM_PAGE_SIZE - 1) 
183 | #define POOL_SIZE_MASK SYSTEM_PAGE_SIZE_MASK 


297 | #define POOL_ADDR(P) ((poolp)((uptr)(P) & ~ (uptr)POOL_SIZE_MASK)) 





光 这 么 看 有 些 难 理解 ,我们 试 着 展开 宏 ， 去 掉 多 余 的 东西 。 
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Objects/obmalloc.c: POOL_ADDR() (省 略 版 ) 
297 | #define POOL_ADDR(P) (P & Oxfffff000) 


这 里 好 像 对 参数 P 进行 了 标记 处 理 。 那 为 什么 这 样 就 能 获得 pool 的 地 址 呢 ? 


大 家 请 回忆 一 下 pool 地 址 对 齐 的 知识 。 没 错 ， 是 按 4K 字 节 对 齐 的 。 也 就 是 说 ， 只 要 从 
pool 内 部 某 处 block 的 地 址 开始 用 oxfffff000 标记 ， 肯 定 能 取 到 pool 的 开头 。 








pool 
(4K 字 节 ) 
0xb7e65000 
(4K 字 节 对 齐 ) Oxb7e65724 


0xb7e65724 & 0xfffff000 = 0xb7e65000 
一 次 标记 处 理 就 能 获取 开头 地 址 




















图 10.18 用 标记 处 理 获取 pool 地 址 











一 般 认 为 从 地 址 去 找 所 属 的 pool 是 一 项 非常 花 时 间 的 处 理 。 比 较 笨 的 办 法 就 是 取出 一 
pool， 检 查 其 范围 内 是 否 有 对 象 的 地 址 ， 如 果 没 有 就 再 取出 下 一 个 pool…… 但 是 这 样 一 来 ， 
每 次 pool 增加 时 计算 量 也 会 相应 地 增加 。 
通过 使 用 这 个 对 齐 手法 ,仅仅 需要 一 次 标记 处 理 就 能 找到 对 象 的 pool。 这 是 0(1) 的 算法 ， 
是 一 个 很 棒 的 技巧 。 


【专属 第 3 层 对 象 特 有 的 分 配器 


对 象 有 列表 和 元 组 等 多 种 多 样 的 型 ， 在 生成 它们 的 时 候 要 使 用 各 自 特有 的 分 配 需 。 
在 这 里 我 们 以 生成 对 象 的 代码 最 为 简单 的 字典 为 例 ， 一 起 来 看 看 吧 。 
在 字典 对 象 中 定义 的 空闲 链表 很 简单 ， 如 下 所 示 。 
























































Objects/dictobject.c 
205 | #ifndef PyDict_MAXFREELIST 
206 | #define PyDict_MAXFREELIST 80 
207 | #endif 
208 | static PyDictObject *free_list[PyDict_MAXFREELIST]; 


209 | static int numfree = 0; 


里 将 空闲 链表 定义 为 有 着 80 个 元 素 的 数组 ， 使 用 完毕 的 链表 对 象 会 被 初始 化 并 存 人 


这 
空闲 链表 中 。 
负责 释放 字典 对 象 的 函数 如 下 所 示 ， 这 里 省 略 掉 了 不 需要 讲解 的 部 分 。 
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Objects/dictobject.c 
929 | static void 
930 | dict_dealloc(register PyDictObject *mp) 
931 | 攻 
/* 省 略 部 分 : 释放 字典 对 象 内 的 元 素 */ 
/* 检查 空闲 链表 是 否 为 空 */ 
/* 检查 释放 对 象 是 否 为 字典 型 */ 
945 if (numfree < PyDict_MAXFREELIST && Py_TYPE(mp) == &PyDict_Type) 
946 free_list[numfree++] = mp; 
947 else 
948 Py_TYPE(mp)->tp_free((PyO0bject *)mp); 
950|} 





像 这 样 ， 如 果 在 释放 字典 对 象 时 空 闪 链表 有 空间 ， 那 么 就 将 使 用 完毕 的 字典 对 象 存 入 空 
闲 链表 。 男 一 方面 ， 如 采 使 用 完毕 的 字典 对 象 把 用 于 空闲 链 表 的 数组 填 满 了 ， 就 认为 已 经 没 
必要 再 为 空闲 链表 保留 对 象 ， 直 接 调用 释放 操作 。 

接 下 来 是 非常 重要 的 部 分 分 配 字典 对 象 ， 请 看 下 面 的 源 代码 。 


























Objects/dictobject.c 
223 | PyObject * 
224 | PyDict_New(void) 
225 | { 
226 register PyDictObject *mp; 
/* 检查 空闲 链表 内 是 否 有 对 象 */ 
238 if (numfree) { 
239 mp = free_list[--numfree]; 
242 _Py_NewReference((PyObject *)mp); 
256 } else { 
/* 如 果 没 有 对 象 就 新 分 配对 象 */ 
257 mp = PyObject_GC_New(PyDictObject, &PyDict_Type); 
258 if (mp == NULL) 
259 return NULL ; 
264 二 
270 return (PyObject *)mp; 
271|} 
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如 果 空 闪 链 表 里 有 对 象 ， 函 数 就 返回 它 。 如 果 空 闪 链 表 里 没 有 对 象 ， 就 分 配 新 的 对 象 。 

用 到 这 个 空闲 链表 的 分 配 融 就 是 第 1 层 的 “对 象 特 有 的 分 配 融 ”。 

这 个 对 象 特有 的 分 配 需 还 实现 了 “列表 ”“ 元 组 ” 等。 这些 型 会 频 款 地 生成 和 删除 对 象 ， 
如 果 每 次 都 要 调用 第 2 层 、 第 1 层 、 第 0 层 的 分 配器 ,那么 处 理 起 来 将 会 很 麻烦 。 因 此 我 们 
通过 空闲 链表 重复 利用 一 定 个 数 。 
































free list 














存储 使 用 完毕 的 对 象 的 指针 





10.19 ”对象 特有 的 空闲 链表 

















此 外 ， 这 个 空闲 链表 和 栈 一 样 采用 FILO 的 方式 。 也 就 是 说 ， 在 往 空 闲 链 表 中 存 人 数据 时 ， 
最 新 的 数据 会 在 最 上 面 ， 在 从 空间 链表 中 取出 数据 时 ,会 优先 取出 位 于 最 上 面 的 新 数据 。 
分 配器 的 总 结 


前 面 讲 过 的 第 0 层 到 第 3 层 的 分 配器 可 总 结 为 下 图 。 
Python 在 生成 字典 对 象 的 时 候 ， 分配 带 所 进行 的 交互 如 图 10.20 所 示 。 


请 给 我 PyDictObject (字典 对 象 )l 个 从 空闲 链表 中 分 配 各 个 对 象 
(如 果 空 闲 链表 为 空 则 调用 第 2 





普 
























































请 给 我 sizeof(PyDictObject) 分 配 从 pool 获得 的 block 

字 节 的 block! (如 果 没 有 pool 则 调用 第 1 层 ) 

请 给 我 sizeof(PyDictObject) 从 arena 分 出 pool 

字 节 用 的 pool! (如 果 没 有 arena 则 调用 第 0 层 ) 
第 1 层 usable arenas->freepools、new_ arena() 

我 想 做 个 arena， 请 给 我 256K 、 本 

字 节 的 内 存 空 间 ! 返回 256K 字 节 的 内 存 空间 


图 10.20 分 配器 层 的 总 结 
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【在 : 镜 引用 计数 法 


接 下 来 让 我 们 一 起 来 看 看 在 Python 内 是 如 何 实现 引用 计数 法 的 。 

















10.8.1 ” 增 量 
在 引用 计数 法 中 ， 各 个 对 象 的 内 部 都 有 着 计数 器 。 如 果 对 象 的 引用 数量 增加 ， 就 在 计数 
需 上 加 1， 反 过 来 如 果 引 用 数量 减少 ， 就 在 计数 器 上 减 去 1。 
实际 的 计数 操作 是 由 宏 Py_INCREF() 执行 的 ， 这 里 省 去 了 宏 内 用 于 debug 的 处 理 。 





Include/object.h 
648 | #define Py_INCREF(op) ( \ 
650 ((PyObject*) (op))->ob_refcnt++) 


此 外 还 有 一 并 执行 NULL 检查 的 宏 Py_XINCREF () 。 


Include/object.h 
703 | #define Py_XINCREF(op) if ((op) == NULL) ; else Py_INCREF(op) 








我 们 经 常 在 C 语言 的 源 代码 中 看 到 宏 名 称 中 的 字母 XY， 这 是 “eXtend” (扩展 ) 的 缩写 。 拿 


宏 Py_XINCREF () 来 说 ， 意 思 就 是 含有 NULL 检查 操作 的 宏 Py_INCREF () 。 


10.8.2 _ Q: 计数 器 不 会 出 现 溢出 吗 ? 

关于 这 个 问题 我 们 已 经 在 第 3 章 中 讲 过 了 。 大 家 应 该 还 记得 ， 当 时 准备 了 一 个 被 所 有 指 
针 指 着 也 不 要 紧 的 计数 器 。 

下 面 我 们 就 来 看 看 在 Python 中 实际 是 如 何 避 免 溢 出 的 。 

















Include/object.h: 再 次 运行 
101 | typedef struct _object { 


102 _PyObject_HEAD_EXTRA 
103 Py_ssize_t ob_refcnt; 
104 struct _typeobject *ob_type; 


105 | } PyObject; 


用 Py_ssize_t 型 定义 成 员 op_refcnt (引用 计数 姨 )。 


Include/object.h 


102 | typedef ssize_t Py_ssize_t; 


用 ssize_t 型 定义 Py_ssize_t 型 。 
ssize_t 型 在 32 位 环境 下 就 是 int 型 ， 在 64 位 环境 下 就 是 1ong 型 ， 可 见 各 自 跟 它们 
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的 指针 的 大 小 一 样 。 

因为 有 符号 位 ， 所 以 只 有 一 半数 值 能 用 非 负 整数 表示 。 但 是 因为 指针 基本 上 都 是 按 4 字 
节 对 齐 的 ， 所 以 即使 引用 计数 器 被 所 有 指针 引用 ， 也 不 会 溢出 。 

这 就 有 了 一 个 新 的 疑问 : 为 什么 计数 器 会 允许 存在 负数 呢 ? 用 无 符号 型 不 就 好 了 吗 ? 

实际 上 这 样 是 为 了 debug。 当 引用 计数 器 存 在 负数 时 ， 束 有 减 量 操作 过 度 或 增 量 操作 遗 
漏 的 可 能 。 人 允许 引用 计数 器 存在 负数 值 就 是 为 了 进行 检查 。 


























Include/object.h 


597 | #define _Py_CHECK_REFCNT(OP) \ 

598 | if (((PyObject*)0P)->ob_refcnt < 0) N 
599 _Py_NegativeRefcount(__FILE__，__LINE__， \ 

600 (PyObject *) (OP) ) ; \ 

601 | 上 

















如 果 这 项 处 理 是 构建 Python 以 用 于 debug 的 , 那么 就 会 被 插入 减 量 操作 。_Py- 
NegativeRefcount () 函数 会 把 变 为 负数 的 对 象 信息 当成 错误 信息 输出 。 
10.8.3 ” 减 量 操作 
下 面 该 讲 减 量 操作 了 。 
省 略 不 需要 的 debug 处 理 ， 整 理 后 代码 如 下 所 示 。 





Include/object.h 


652 | #define Py_DECREF (op) \ 
if (--((PyObject*) (op))->ob_refcnt != 0) \ 
655 _Py_CHECK_REFCNT (op) N\ 
656 else \ 
657 _Py_Dealloc((PyObject *) (op)) 


先 将 计数 需 减 量 ,， 如 果 得 出 0 以 外 的 数值 ,就 调用 宏 _Py_CHECK_REFCNT()。_Py_ 
CHECK_REFCNT() 是 用 于 debug 的 宏 ， 它 负责 检查 引用 计数 需 是 否 变 为 了 负数 。 
如 果 计 数 器 为 0， 那么 就 调用 宏 _Py_Dealloc()。 
































Include/object.h 


643 | #define _Py_Dealloc(op) ( 
645 (*Py_TYPE(op)->tp_dealloc) ((Py0bject *) (op))) 





跟 增 量 操作 一 样 ， 这 里 也 有 NULL 检查 扩展 的 减 量 操作 。 





Include/object.h 





704 | #define Py_XDECREF(op) if ((op) == NULL) ; else Py_DECREF (op) 
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成 员 tp_dealloc 里 存 着 负责 释放 各 个 对 象 的 函数 指针 ， 比 如 下 面 这 个 负责 释放 元 组 对 
象 的 函数 指针 。 














Objects/tupleobject.c 
160 | static void 
161 | tupledealloc(register PyTuple0bject *op) 
162 | 1{ 
163 register Py_ssize_t i; 
164 register Py_ssize_t len = Py_SIZE(op) ; 
167 if (len > 0) { 
168 i = len; 
/* 将 元 组 内 的 元 素 进行 减 量 */ 
169 while (--i >= 0) 
170 Py_XDECREF (op->ob_item[i]); 
182 } 
/* 释放 元 组 对 象 */ 
183 Py_TYPE(op)->tp_free((PyO0bject *)op); 
185 Py_TRASHCAN_SAFE_END (op) 
186|} 








为 了 释放 元 组 对 象 ， 函 数 对 元 组 中 元 素 的 引用 计数 器 进行 减 量 操 作 ， 之 后 调用 对 象 的 成 
员 tp_free 中 的 函数 指针 。 

成 员 tp_free 里 也 存 着 各 个 对 象 的 释放 人 处理 数据 。 不 过 大 部 分 情况 下 调用 的 都 是 
Py0bject_GC_Del() 函数 。 














Modules/gcmodule.c 





1380 | void 

1381 | Py0bject_GC_Del(void *op) 

1382 | 1{ 

1383 PyGC_Head *g = AS_GC(op); 
/* 省 略 部 分 : 释放 前 的 处 理 */ 

1389 PyObject_FREE (g); 

1390|} 





这 里 出 现 的 Py0bject_FREE() 就 是 之 前 在 10.3 节 中 出 现 的 Py0bject_Free() 函数 。 这 
下 终于 跟 10.3 节 接 轨 了 。 


Include/objimpl.h 
121 | #define PyO0bject_FREE Py0bject_Free 











10.8 引用 计数 法 








元 组 减 量 操作 的 调用 图 如 下 所 示 。 





Py_DECREF 减 量 操作 
_Py_Dealloc 
tupledealloc 一 一 元 组 释放 处 理 
PyObject_GC_Del 
PyObject_FREE 
PyObject_Free 一 一 释放 内 存 


10.8.4 “终结 器 


既然 讲 到 了 释放 对 象 的 话题 ， 不 如 就 在 这 里 介绍 一 下 终结 器 (finalizer) 吧 。 

终结 器 指 的 是 与 对 象 的 释放 处 理 挂钩 ， 进 行 某 些 处 理 的 功能 。 

列表 和 字典 等 内 置 数据 类 型 的 对 象 基 本 上 是 不 能 设置 终结 需 的 ， 能 定义 终结 器 的 只 有 用 
户 创建 的 类 。 

我 们 可 以 像 下 面 这 样 定义 终结 























class Foo: 


def _ del__(self): # 定义 终结 器 


print ("Bye...") 
这 种 情况 下 会 生成 Foo 类 的 实例 ， 从 内 存 中 释放 这 个 实例 时 会 输出 “Bye...”。 


那么 Foo 类 实例 实际 上 是 怎样 调用 的 呢 ? 肯定 是 在 释放 对 象 的 时 候 调用 的 吧 。 
释放 Foo 类 实例 的 调用 图 如 下 所 示 。 


























Py_DECREF 减 量 操作 
_Py_Dealloc 
subtype_dealloc 一 一 实例 释放 处 理 
slot_tp_del 一 一 终结 天 


subtype_dealloc() 玉 数 看 上 去 很 怪 。 赶 紧 来 一 起 看 看 它 吧 。 函 数 虽 然 比较 大 ， 不 过 单 
独 把 终结 融 的 部 分 拿 出 来 看 就 不 怎么 难 了 。 


Objects/typeobject.c:subtype_dealloc(): 单独 拿 出 终结 器 的 部 分 
846 | static void 
847 | subtype_dealloc (PyO0bject *self) 


848 | 
849 PyTypeObject *type, *base; 
850 destructor basedealloc; 


851 
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853 type = Py_TYPE(self); 
920 if (type->tp_del) { 
921 _PyObject_GC_TRACK (self); 
922 type->tp_del(self) ; 
938 
/* 省 略 */ 
1074|} 














实例 的 情况 下 ， 变 量 tp_del 中 保存 着 执行 终结 器 所 需 的 slot_tp_del() 函数 。 这 也 是 
一 个 大 函数 ， 不 过 除去 debug 和 错误 检查 处 理 ， 其 实 还 是 很 简单 的 。 





Objects/typeobject.c:slot tp_del() 























5257 | static void 
5258 | slot_tp_del(PyO0bject *self) 
5259 |{ 
5260 static Py0bject *del_str = NULL; 
5261 Py0bject *del, *res; 
5266 self->ob_refcnt = 1; 
5267 
5271 /* 如 果 有 __del__ 就 执行 它 */ 
5272 del = lookup_maybe(self, "__del__", &del_str); 
5273 if (del != NULL) { 
5274 res = PyEval_CallObject (del, NULL); 
/* 省 略 部 分 : 错误 检查 和 后 处 理 等 */ 

5280 } 
5281 
5289 if (--self->ob_refcnt == 0) 
5290 return; /* 退出 浮 数 */ 

/* 省 略 部 分 : 最 终 化 时 有 引用 的 情况 下 的 应 对 处 理 */ 
5315 | } 





先 用 lookup_maybe() 函数 取出 实例 中 的 __qel__0 方法 ， 然 后 用 PyEval_Call0bject() 
函数 评价 它 。 以 Foo 类 为 例 ， 此 时 会 输出 “Bye. ..”。 
第 5266 行 代码 将 对 象 的 引用 计数 器 设 为 1。 


10.9 引用 的 所 有 权 


在 第 5289 行 对 这 个 计数 需 进 行 减 量 ， 在 第 5290 行 退 出 函数 。 

如 果 最 终 化 (finalize ) 过 程 中 对 象 (self) 有 新 的 引用 ， 那 么 在 第 5289 行 引 用 计数 需 就 不 
会 为 0。 因 此， 之 后 的 处 理 不 会 对 对 象 进 行内 存 释 放 。 这 项 处 理 跟 最 终 化 的 本 质 无 关 ， 所 以 
不 予 歼 述 。 


10.8.5 ”插入 计数 处 理 


阅读 Python 的 源 代 码 时 ， 大 家 经 常会 看 到 引用 计数 的 增 量 操作 和 减 量 操作 。 

事实 上 , 在 加 工 Python 的 处 理 程序 时 ， 就 必须 适当 进行 增 量 操作 和 减 量 操作 。 在 
Python 中 可 以 编写 C 的 扩展 模块 ， 不 过 也 同样 需要 留意 引用 计数 。 

引用 计数 中 像 增 量 和 减 量 这 样 的 计数 处 理 基本 上 都 是 在 生成 指向 对 象 的 引用 时 进行 的 。 
进行 引用 的 一 方 不 一 定 是 Python 的 对 象 ， 也 可 以 是 C 语言 的 全 局 变量 或 局 部 变量 。 

不 过 计数 处 理 不 是 放 在 哪里 都 行 的 。 

举 个 例子 ， 当 从 局 部 变量 引用 时 ， 绝 大 多 数 情况 下 都 可 以 不 执行 计数 处 理 。 就 算 从 局 部 
变量 引用 时 进行 了 增 量 操作 ， 最 后 退出 作用 域 时 还 是 要 进行 减 量 操作 。 因 为 从 结果 上 来 说 引 
用 计数 天 的 值 是 不 变 的 ， 所 以 即使 进行 了 计数 处 理 ， 也 没有 什么 意义 (当然 也 可 以 进行 计数 
处 理 ， 不 过 会 带 来 额外 负担 )。 

本 来 引用 计数 法 的 计数 处 理 就 有 “保护 某 个 正在 使 用 的 东西 引用 的 对 象 (不 让 其 释放 刀 
的 意思 。 

如 果 对 象 的 引用 计数 需 大 于 等 于 1， 那 它 就 已 经 进入 了 被 保护 的 状态 ， 如 果 这 个 对 象 的 
计数 最 后 能 抵消 的 话 ， 就 可 以 省 去 计数 操作 本 身 。 

但 是 在 局 部 变量 作用 域内 对 象 的 引用 计数 融 可 能 为 0 的 情况 下 ， 就 必须 切实 执行 计数 处 
理 和 保护 操作 。 

像 这 样 ， 有 根据 时 间 和 场合 来 插入 计数 的 情况 ， 也 有 可 以 不 插入 计数 的 情况 。 这 完全 由 
程序 员 自 己 判断 ， 不 过 如 果 不 知道 该 怎么 办 的 话 ， 还 是 执行 计数 处 理 比较 好 ， 这 样 才 不 会 引 
发 错误 。 

此 外 , 在 以 C 语 言 的 水 准 对 Python 的 对 象 进 行 操作 时 ， 有 必要 留意 计数 处 理 。 当 以 
Python 的 水 准 写 程 序 的 时 候 ， 语 言 处 理 程序 会 适当 地 执行 计数 处 理 ， 所 以 作为 语言 使 用 者 ， 
我 们 不 用 特别 去 关注 引用 计数 。 请 大 家 认识 到 这 一 点 。 


【 记 放 引用 的 所 有 权 


谈 到 引用 计数 法 和 调用 各 个 函数 的 知识 ， 就 涉及 了 “引用 的 所 有 权 ”。 
在 这 里 笔者 想 让 大 家 注意 一 点 ， 就 是 所 有 权 不 是 对 于 “对 象 " ， 而 是 对 于 “引用 ”而 言 的 ( 顺 
便 一 提 ， 对 象 中 是 没有 所 有 权 这 个 概念 的 )。 











































































































































































































239 


240 第 10 章 Python 的 垃圾 回收 


谁 持 有 引用 的 所 有 权 ， 谁 就 得 承担 在 不 需要 此 引用 时 将 对 象 的 引用 计数 器 减 量 (Py-_ 
DECREF() ) 的 责任 。 也 就 是 说 ， 引 用 结束 的 时 候 要 负责 收拾 烂 挫 子 。 

这 个 “引用 的 所 有 权 ” 对 函数 的 返回 值 和 参数 有 着 重大 意义 。 

10.9.1 ”传递 引用 的 所 有 权 ( 返 回 值 ) 


“传递 引用 的 所 有 权 ” 指 的 是 函数 方 把 引用 的 所 有 权 和 返回 值 一 起 交 给 调用 方 。 









































调用 方 函数 方 
所 有 权 Sy 
引用 Ne. 昌 
对 象 对 象 


图 10.21 传递 引用 的 所 有 权 


把 指向 对 象 的 引用 返回 给 调用 方 的 函数 一 般 都 会 将 所 有 权 一 起 交 给 调用 方 。 

如 果 函 数 的 调用 方 拿 到 了 引用 的 所 有 权 ， 那么 在 指向 对 象 的 引用 结束 时 就 要 负 起 责任 执 
行 减 量 操 作 。 

生成 新 对 象 的 所 有 函数 负责 把 引用 的 所 有 权 交 给 调用 方 。 举 个 例子 , 在 以 前 讲 过 的 
PyDict_New() 函数 里 也 有 负责 传递 引用 所 有 权 的 地 方 。 














Objects/dictobject.c 
223 | PyObject * 
224 | PyDict_New(void) 
225 | { 
226 register PyDictObject *mp; 
/* 检查 空闲 链表 内 是 否 有 对 象 */ 

238 if (numfree) { 
239 mp = free_list[--numfree] ; 

/* 追加 新 的 引用 */ 
242 _Py_NewReference((PyObject *)mp); 
256 } else { 

/* 如 果 没 有 就 新 分 配对 象 (省 略 ) */ 
264 上 
270 return (PyObject *)mp; 
2 | 





10.9 引用 的 所 有 权 


宏 _Py_NewReference() 的 定义 如 下 所 示 。 


Include/object.h: 省 略 debug 处 理 


112 | #define Py_REFCNT (ob) (((PyObject*) (ob))->ob_refcnt) 
636 | #define _Py_NewReference(op) ( \ 
639 Py_REFCNT(op) = 1) 


可 见 引 用 计数 需 被 设置 成 了 1。 

像 这 样 ， 在 PyDict_New() 中 将 对 象 的 引用 计数 天 设置 为 1， 返回 调用 方 。 引 用 计数 需 
的 值 1 的 意思 是 “调用 方 的 引用 "。 也 就 是 说 ， 这 个 引用 计数 器 需要 调用 方 来 进行 减 量 操作 ， 
这 就 是 在 传递 所 有 权 。 














PyObject *dict = PyDict_New() ; 
Py_DECREF (dict) ; 
dict = NULL; 





因为 调用 方 已 经 拿 到 了 引用 的 所 有 权 ( 成 了 所 有 者 )， 所 以 在 引用 结束 时 就 需要 切实 执行 

10.9.2 ”出 借 引 用 的 所 有 权 ( 返回 值 ) 

“出 借 引 用 的 所 有 权 ” 指 的 是 函数 方 只 把 返回 值 交 给 调用 方 ， 至 于 引用 的 所 有 权 则 只 是 
出 借 而 已 。 

当 调 用 方 借 到 了 引用 的 所 有 权时 ， 就 不 能 对 这 个 引用 调用 减 量 操 作 了 。 因 为 只 是 借 走 了 
所 有 权 ， 如 果 随 便 破 坏 所 有 权 的 话 ， 真 正 的 所 有 者 想必 会 勃然 大 级 吧 。 




































































调用 方 函数 广 调用 方 函数 方 
所 有 权 出 借 
OO 
引用 引用 
对 象 对 象 


10.22 出 借 引用 的 所 有 权 
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此 外 ,借方 只 能 在 贷方 (所 有 者 ) 指 定 的 期 限 内 持 有 对 象 。 这 是 因为 贷方 只 能 确保 在 指 
定期 限 内 持 有 对 象 ， 一 旦 超过 了 期 限 ， 就 可 能 释放 对 象 了 ， 所 以 借方 必须 遵守 所 有 者 定 下 
的 规矩 。 

出 借 引 用 所 有 权 的 代表 性 函数 有 PyTuple_GetItem() 。 一 旦 调用 PyTuple_GetItem() ， 元 组 

旨 定 的 索引 元 素 就 会 被 返回 给 调用 方 。 
Objects/tupleobject.c: 省 略 检查 操作 
97 | PyObject * 


98 | PyTuple_GetItem(register Py0bject *op, register Py_ssize_t i) 
99 | 荆 








/* 省 略 检查 元 素 的 操作 */ 


108 return ((PyTupleObject *)op) -> ob_item[i] ; 
109 | 上 








在 这 里 没有 增加 引用 计数 器 以 让 调用 方 引 用 。 也 就 是 将 ， 没 有 把 引用 的 所 有 权 交 给 调用 方 。 
PyObject *tuple; 


PyObject *item = PyTuple_GetItem(tuple, 0); 
item = NULL; 





/#k Py_DECREF(item); 不 能 这 人 么 干 ! ! */ 





因为 调用 方 只 是 借 到 了 引用 的 所 有 权 ， 所 以 即使 引用 结束 也 不 能 对 其 执行 减 量 操 作 。 

笔者 一 开始 觉得 很 不 可 思议 :“ 为 什么 要 这 样 ? 把 引用 的 所 有 权 全 部 交 给 调用 方 不 就 简 
单 多 了 吗 ?” 

然而 ， 如 果 调 用 方 只 是 借 到 了 引用 的 所 有 权 ， 那 么 写 代码 的 时 候 就 不 用 在 意 对 象 的 减 量 
操作 了 。 如 果 只 是 “ 想 取 得 少量 链表 里 的 元 素 并 输出 ”的 话 ， 这 种 方法 用 起 来 显然 更 简单 ， 
也 很 难 因为 忘记 执行 减 量 操 作 而 产生 BUG。 

执行 出 借 所 有 权 操 作 的 函数 还 有 PyList_GetItem()、PyDict_GetItem() 等 。 它 们 都 是 
负责 从 集合 中 取出 元 素 的 函数 。 


10.9.3 ”占据 引用 的 所 有 权 ( 参 数 ) 

前 面 我 们 一 直 在 谈 函 数 的 返回 值 ， 这 次 该 说 参数 了 。 

当 调 用 方 把 参数 传递 给 函数 时 ， 函 数 方 有 时 会 占据 这 个 参数 的 引用 所 有 权 。 

当 对 象 的 引用 所 有 权 被 占据 时 ， 调 用 方 就 没有 责任 对 这 个 对 象 进行 减 量 操作 了 。 
占据 所 有 权 的 代表 性 函数 有 PyTuple_SetItem() 函数 。 




















10.9 引用 的 所 有 权 





















































对 象 对 象 


图 10.23 占据 引用 的 所 有 权 


Objects/tupleobject.c: 省 略 检查 操作 


111 
442 


113 
114 
45 


27 
128 
129 
130 
131 
132 





int 
PyTuple_SetItem(register PyObject *op, 
register Py_ssize_t i, PyObject *newitem) 
{ 
register Py0bject *olditem; 
register PyObject **p; 


p = ((PyTuple0bject *)op) -> ob_item + i; 

olditem = *p; /* 取出 原本 存 有 的 对 象 */ 

*p = newitem; /* 追加 到 元 组 */ 

Py_XDECREF (olditem); /* 对 取出 的 对 象 进行 减 量 操作 */ 


return 0; 














} 


这 个 函数 负责 将 元 素 追 加 到 元 组 。 函 数 的 参数 分 别 为 元 组 、 索 引 以 及 要 追加 的 元 素 。 

需要 大 家 注意 的 是 ， 这 里 没有 对 追加 到 元 组 的 元 素 进行 增 量 操作 。 因 为 给 对 象 增 加 了 一 
个 新 的 引用 ， 按 理 说 必须 进行 增 量 操作 才 对 …… 

事实 上 这 正 是 “占据 引用 的 所 有 权 ” 的 真面目 。 

调用 方 所 持 有 的 引用 所 有 权 ， 实 际 上 是 对 象 内 计数 天 的 个 计数 。 也 就 是 说 ， 虽 然 这 里 


























是 从 元 组 引用 的 ， 但 故意 不 对 这 个 引用 进行 增 量 操作 ， 以 此 夺取 调用 方 的 1 个 计数 。 

我 们 该 怎么 使 用 这 个 “占据 引用 的 所 有 权 ” 呢 ?“ 占 据 所 有 权 ” 乍 一 听 很 难听 ， 不 过 要 是 
能 妥善 利用 ， 编 程 就 会 变 得 非常 轻松 。 
举 个 例子 ， 系 统 通 过 调用 函数 把 引用 的 所 有 权 交 给 调用 方 的 时 候 ， 直 接 让 下 一 个 调用 函 






































数 把 所 有 权 偷 走 ， 这 样 就 能 很 灵活 地 写 出 代码 。 
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PyObject *tuple, *dict; 


tuple = PyTuple_New(3) ; 
































dict = PyDict_New(); /* 跟 引 用 的 所 有 权 一 起 生成 空 的 字典 */ 
PyTuple_SetItem(tuple, 0, dict); /* 追加 字典 */ 
dict = NULL; 





/* 没有 必要 执行 减 量 操 作 */ 











在 往 元 组 里 追加 元 素 的 时 候 ， 实 际 上 持 有 元 素 的 不 是 调用 方 ， 而 是 元 组 。 这 样 的 话 ， 元 
组 持 有 引用 的 所 有 权 才 更 自然 吧 。 

占据 参数 的 引用 所 有 权 的 函数 还 有 PyList_SetItem() 函数 ， 它 和 PyTuple_SetItem() 函数 
相同 ， 都 是 往 链表 中 追加 元 素 的 函数 。 


10.9.4 出借 引用 的 所 有 权 ( 参 数 ) 
调用 方 把 参数 的 引用 所 有 权 借 给 函数 方 是 很 常见 的 。 














调用 方 


日 | 旧 _ 中 


所 有 权 





























引用 














对 象 对 象 


图 10.24 出 借 引 用 的 所 有 权 





当 函 数 的 调用 方 要 出 借 引用 的 所 有 权时 ， 从 把 对 象 交 给 函数 之 后 直到 函数 执行 结束 为 止 ， 
这 段 时 间 调 用 方 都 必须 保留 指向 对 象 的 引用 的 所 有 权 。 

对 于 这 个 对 象 ， 只 要 调用 方 有 一 个 所 有 权 ， 那 么 就 直接 把 对 象 交 给 ss 
调用 方 一 个 所 有 权 也 没有 ， 那 么 对 象 就 可 能 会 被 释放 ， 因 此 这 里 必须 执行 增 量 操作 来 保留 引 
用 的 所 有 权 。 


10.9.5 “使 用 引用 计数 法 会 留 下 BUG 吗 


说 到 这 里 ， 大 家 应 该 差不多 明白 了 ,在 引用 计数 法 中 ， 程 序 员 必须 时 刻 留意 着 对 象 的 引 
用 来 编程 。 当 然 ， 如 果 是 Python 水 准 的 话 就 不 用 在 乎 引用 计数 法 了 ,不 过 想 要 扩展 Python 
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时 还 是 需要 在 乎 引用 计数 法 的 。 

不 过 我 们 毕 范 是 人 ， 在 这 一 点 上 不 能 保证 完全 不 出 错 。 举 个 例子 ， 我 们 可 能 会 因为 单纯 
忘记 了 执行 减 量 操作 而 造成 对 象 没有 释放 ， 或 者 把 对 象 交 给 引用 所 有 权 被 盗 走 的 函数 后 又 执 
行 了 减 量 操作 ,结果 释 放 了 活动 对 象 等 。 

考虑 到 这 里 ,笔者 认为 比 起 标记 - 清除 算法 等 算法 来 说 ,还 是 引用 计数 法 更 容易 产生 
BUG。 

不 过 话说 回来 ,虽说 容易 产生 BUG， 但 并 不 意味 着 就 不 能 使 用 引用 计数 法 了 。 就 像 之 
前 在 第 3 章 中 所 讲 的 那样 ， 引 用 计数 法 有 着 很 多 优点 ， 比 如 mutator 的 最 大 暂停 时 间 较 得 等 。 
这 里 应 该 权衡 它 的 优点 和 缺点 ， 根 据 语 言 和 应 用 程序 的 特性 来 判断 适 不 适合 采用 引用 计数 法 。 


@@ 


7 




















机 械 性 的 计数 操作 
使 用 引用 计数 法 容易 留 下 BUG 隐患 的 原因 是 程序 员 进行 了 计数 操作 。 然 而 世间 还 有 一 些 东西 ， 





可 以 通过 机 械 性 的 计数 操作 来 排除 人 类 导致 的 错误 。 

其 中 著名 的 是 C++ 的 shared_ptr。shared_ptr 会 机 械 性 地 执行 计数 操作 ， 当 不 再 需要 某 
个 对 象 时 ( 即 引用 计数 器 为 0 时 )， 就 会 废弃 这 个 对 象 。 

这 样 一 来 ， 即 便 同样 是 引用 计数 法 ， 也 可 以 通过 改变 计数 操作 的 方法 来 消除 BUG。 

那么 ， 为 什么 Python 的 语言 处 理 程序 内 没有 采用 机 械 性 的 计数 操作 呢 ? 答案 是 机 械 性 的 计 
数 操作 太 慢 了 。 一 旦 执行 机 械 性 计数 ， 就 不 得 不 进行 故障 保护 来 计数 ， 这 样 一 来 有 时 就 会 造成 计 
数 操作 过 多 。 

对 于 Python 而 言 ， 计 数 操作 很 大 程度 上 关系 到 语言 处 理 程序 的 性 能 ， 所 以 不 能 随便 决定 去 
机 械 性 地 执行 它 。 




































































【前 如 何 应 对 有 循环 引用 的 垃圾 对 象 


作为 本 章 的 结尾 ， 我 们 来 介绍 一 下 Python 是 采用 何 种 途径 解决 循环 引用 问题 的 。 

引用 计数 法 有 一 个 致命 的 问题 ， 即 无 法 释放 有 循环 引用 的 垃圾 ， 这 一 点 在 第 2 章 中 已 经 
提 到 过 了 。 当 然 ，Python 也 一 样 存在 这 个 问题 。 

我 们 在 第 2 章 中 讲 过 部 分 标记 - 清除 算法 。Python 的 垃圾 回收 则 在 此 基础 上 加 以 改良 ， 
据 此 来 解决 循环 引用 的 问题 。 
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10.10.1 ”循环 引用 垃圾 回收 的 算法 
首先 从 算法 部 分 开始 说 明 。 
图 10.25(1) 表示 的 是 对 象 之 间 的 引用 关系 。 从 自 对 象 指向 他 对 象 的 引用 用 黑 箭 头 表示 。 
每 个 对 象 里 都 正确 记录 着 引用 计数 器 。 此 外 ， 请 大 家 确认 在 图 中 有 循环 引用 的 垃圾 对 象 群 。 
我 们 继续 进行 下 一 个 步骤 ,来 去 除 这 个 循环 引用 。 
由 图 10.25(2) 可 见 ， 对 象 的 引用 计数 器 已 经 被 复制 到 了 自 对 象 内 的 另 一 个 存储 空间 里 。 





TT 
(循环 引用 ) 
(循环 引用 ) 


1 Python 对 象 
(循环 引用 ) 
1 Python 
对 象 


图 10.25 循环 引用 释放 算法 (1) 





Python 对 象 
复制 | 〈 钉 环 引用 ) 





Python 对 象 
妈 j | (3 用 ) 


Python 对 象 
知 计 | 钉 环 引用 ) 











图 10.25 循环 引用 释放 算法 (2) 
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事实 上 各 个 对 象 都 是 用 对 象 链表 连接 的 ， 如 图 10.26(3) 所 示 。 对 象 在 生成 的 时 候 被 连接 
到 链表 ， 我 们 不 采用 一 次 连接 所 有 对 象 的 方法 。 

由 图 10.26(4) 可 知 ， 因 为 存在 对 自 对 象 的 引用 复制 后 的 计数 需 被 执行 了 减 量 操作 。 有 人 
可 能 会 想 :“ 都 已 经 复制 引用 计数 器 了 ， 这 么 做 不 就 韦 得 计数 器 全 部 归 零 了 吗 ?” 

然而 这 里 最 重要 的 一 点 就 是 ， 只 对 从 Python 对 象 的 引用 执行 减 量 操作 。 像 从 根 这 类 非 
Python 对 象 的 引用 ， 是 不 对 其 进行 减 量 处 理 的 。 

这 样 一 来 ， 就 具有 那些 从 根 引 用 的 对 象 的 计数 需 值 为 1 了 。 














(3) © 对 象 链表 (双向 链表 ) 


Python 对 销 
1 | 1 Python 对 象 
(循环 引用 ) 


Python 对 象 
(循环 引用 ) 











图 10.26 循环 引用 释放 算法 (3) 


(4) OO 对 象 链表 (双向 链表 ) 


/ 
1 Python 对 党 | 
(循环 引用 ) 
] Python 对 象 
(循环 引用 ) 
一 1 


不 要 减少 计数 11 


一 1 


Python 对 象 
(循环 引用 ) 











10.26 循环 引用 释放 算法 (4) 
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执行 完 减 量 操 作 后 ， 再 把 对 象 分 成 两 类 分 别 放 入 以 下 链表 中 。 


1. 可 能 到 达 对 象 的 链表 
2. 不 可 能 到 达 对 象 的 链表 


接 下 来 将 这 些 对 象 分 别 用 双向 链表 连接 。 把 程序 可 能 到 达 的 对 象 (活动 对 象 ) 连接 到 第 1 
类 链表 ， 把 程序 不 可 能 到 达 的 对 象 ( 非 活动 对 象 ) 连接 到 第 2 类 链表 。 
之 后 将 具备 如 下 条 件 的 对 象 连接 到 “可 能 到 达 对 象 的 链表 ”。 


1. 经 过 (4) 的 减 量 操作 后 计数 器 值 大 于 等 于 1。 
2. 有 从 活动 对 象 的 引用 。 


另外 ， 再 将 具备 如 下 条 件 的 对 象 连接 到 “不 可 能 到 达 对 象 的 链表 ”。 


1. 经 过 (4) 的 减 量 操作 后 计数 器 值 为 0 
2. 没有 从 活动 对 象 的 引用 


这 样 一 来 ， 分 类 结果 就 如 图 10.27(5) 所 示 了 。 


“® 对 象 链表 (双向 链表 ) 


和 Python 对 象 
(循环 引用 ) 
4 


1 Python 对 象 
(循环 引用 ) 


不 可 能 到 达 对 象 的 链表 CS 可 能 到 达 对 象 的 链表 
( 双向 链表 ) (双向 链表 ) 








图 10.27 循环 引用 释放 算法 (5) 























10.10 如 何 应 对 有 循环 引用 的 垃圾 对 象 
大 家 应 该 明白 了 吧 ， 最 终 所 有 循环 引用 的 垃圾 对 象 群 都 被 连接 到 了 “不 可 能 到 达 对 象 的 
链表 ”， 这 就 意味 着 能 够 发 现 全 部 有 着 循环 引用 的 垃圾 对 象 群 了 。 


到 了 这 一 步 ， 接 下 来 就 是 我 们 说 的 算 了 。 按 顺序 释放 “不 可 能 到 达 的 对 象 " ， 再 把 “可 能 
到 达 的 对 象 ” 按 原样 连接 到 对 象 链表 ， 结 果 如 图 10.27(6) 所 示 。 


























(6) @ 对 象 链表 (双向 链表 ) 








不 可 能 到 达 对 象 的 链表 可 能 到 达 对 象 的 链表 
(双向 链表 ) ( 双向 链表 ) 


图 10.27 循环 引用 释放 算法 (6) 





像 这 样 ， 在 Python 中 只 要 将 “部 分 标记 - 清除 算法 ” 稍 加 变形 ， 就 解决 了 循环 引用 问题 


因为 这 个 循环 引用 释放 算法 是 对 那些 有 循环 引用 关系 的 垃圾 对 象 群 进行 垃圾 回收 ， 所 以 
本 书 中 将 其 称 为 循环 引用 垃圾 回收 。 


10.10.2 ”容器 对 象 




















并 不 是 所 有 Python 对 象 身上 都 会 发 生 循环 引用 。 有 些 对 象 可 能 保留 了 指向 其 他 对 象 的 引用 ， 
这 些 对 象 也 可 能 引起 循环 引用 。 
而 这 些 “ 可 能 





留 了 指向 其 他 对 象 的 引用 的 对 象 ” 就 被 称 为 容 需 对 象 。 
具有 代表 性 的 容 需 对 象 有 元 组 、 列 表 和 字典 。 这 些 对 象 能 保留 指向 其 他 对 象 的 引用 。 
非 容 融 对 象 有 字符 串 和 数值 等 。 这 些 对 象 不 能 保留 指向 其 他 对 象 的 引用 。 
循环 引用 垃圾 回收 的 对 象 只 有 这 些 容器 对 象 。 因 为 字符 串 等 对 象 没 有 循环 引用 的 可 能 
所 以 它们 被 排除 在 循环 引用 垃圾 回收 的 对 象 范围 之 外 。 
容器 对 象 中 都 被 分 配 了 用 于 循环 引用 垃圾 回收 的 头 结构 体 。 
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用 于 循环 引用 垃圾 回收 的 头 

















对 象 数据 





10.28 容器 对 象 的 结构 
这 个 用 于 循环 引用 垃圾 回收 的 头 包含 以 下 信息 。 


1. 用 于 容器 对 象 的 双向 链表 的 成 员 
2. 用 于 复制 引用 计数 器 的 成 员 



































其 定义 如 下 所 示 。 
Include/objimpl.h 
242 | typedef union _gc_head { 
243 Struet. 
244 union _gc_head *gc_next; /* 用 于 双向 链表 */ 
245 union _gc_head *gc_prev; /* 用 于 双向 链表 */ 
246 Py_ssize_t gc_refs; /* 用 于 复制 */ 
247 } es 
248 long double dummy; 
249 | } PyGC_Head; 




















结构 体 PyGC_Head 里 面 是 结构 体 gc 和 成 员 qummy 的 联合 体 。 

在 这 里 成 员 dummy 起 到 了 一 定 的 作用 : 即使 结构 体 gc 的 大 小 为 9 字 节 这 样 不 上 不 下 的 
数值 ， 它 也 会 将 整个 结构 体 PyGC_Head 的 大 小 对 齐 为 long double 型 。 因为 结构 体 gc 的 大 
小 不 太 可 能 变 成 这 样 不 上 不 下 的 数值 ， 所 以 事实 上 aummy 起 到 了 一 个 以 防 万 一 的 作用 。 


10.10.3 ”生成 容器 对 象 


在 生成 容器 对 象 时 ， 必 须 分 配 用 于 循环 引用 垃圾 回收 的 头 。 下 面 让 我 们 来 一 起 看 一 下 这 
部 分 操作 。 

在 这 里 由 _Py0bject_GC_Malloc() 国 数 来 执行 分 配 头 的 操作 。 这 个 函数 是 负责 分 配 所 
有 容器 对 象 的 函数 。 











Modules/gcmodule.c: _PyObject_GC_Malloc(): 只 有 分 配 头 的 部 分 
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1320 | PyObject * 
1321 | _PyObject_GC_Malloc(size_t basicsize) 
二 322 | 元 
1323 PyObject *op; 
1324 PyGC_Head *#g; 
1327 g = (PyGC_Head *)PyObject_MALLOC( 
1328 sizeof (PyGC_Head) + basicsize) ; 
1331 g->gc.gc_refs = GC_UNTRACKED ; 

/* 开始 进行 循环 引用 垃圾 回收 : 后 述 */ 
1342 op = FROM_GC(Cg) ; 
1343 return op ; 
1344 | 上 








第 1327 行 代码 分 配 了 对 象 。 需 要 大 家 注意 的 是 ， 这 里 一 起 额外 分 配 了 结构 体 PyGC_ 
Head 的 大 小 。 可 见 在 分 配对 象 的 同时 ， 也 额外 分 配 了 用 于 循环 引用 垃圾 回收 的 涉 大 小 。 
接 下 来 在 第 1331 行将 GC_UNTRACKED 存 和 信用 于 循环 引用 垃圾 回收 的 头 内 的 成 员 gc_refs 
中 。 
这 个 标志 的 意思 是 “这 个 容器 对 象 没有 被 追踪 ”。 当 出 现 这 个 标志 的 时 候 ，GC 会 认为 这 
个 容器 对 象 没 有 连接 到 对 象 链表 。 
Include/objimpl.h: GC_UNTRACKED 的 别名 
255 | #define _PyGC_REFS_UNTRACKED (-2) 


























这 个 _PyGC_REFS_UNTRACKED 是 GC_UNTRACKED 的 别名 。gc_ref 是 用 于 复制 对 象 的 引用 
计数 需 的 成 员 ， 不 过 它 是 用 负 值 作为 标志 的 。 

刚 开始 笔者 想 :“ 另 外 定义 一 个 用 于 标志 的 成 员 不 就 好 了 吗 ?” 不 过 这 样 是 不 行 的 。 因 为 
所 有 容器 对 象 都 带 有 用 于 循环 引用 垃圾 回收 的 头 ， 所 以 必须 尽 可 能 地 缩小 头 。 因 此 才 让 成 员 
gc_ref 去 承担 标志 的 作用 。 

最 后 在 第 1342 行 和 第 1343 行 调用 宏 FROM_GC() ， 返 回 结 























Modules/gcmodule.c 
33 | #define FROM_GC(g) ((PyObject *)(((PyGC_Head *)g)+1)) 

















这 个 安 会 俩 移 用 于 循环 引用 垃圾 回收 的 头 的 长 度 ， 返 回 正确 的 对 象 地 址 。 正 是 因为 有 这 
项 操作 ， 调 用 方才 不 用 区 别 对 待 带 有 用 于 循环 引用 垃圾 回收 的 头 的 容器 对 象 和 其 他 对 象 。 
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把 这 里 的 地 址 用 于 循环 引用 垃圾 回收 的 头 


返回 给 调用 方 





对 象 数据 





图 10.29 返回 的 地 址 





如 果 结 构 体 PyGC_Head 的 大 小 没有 对 齐 ，FROM_GC() 返回 的 地 址 就 是 没有 被 对 齐 的 不 上 
不 下 的 值 ， 因 此 需要 按 合适 的 大 小 对 齐 结构 体 PyGC_Head 的 大 小 。 


10.10.4 “追踪 容器 对 象 


为 了 释放 循环 引用 ， 需 要 将 容 表 对 象 用 对 象 链表 ( 双 癌 链表 ) 连接 。 在 生成 容 需 对象 之 
后 就 要 马上 连接 链表 。 
下 面 就 以 容器 对 象 一 一 字典 为 例 来 看 看 吧 。 





Objects/dictobject.c 
223 | PyObject * 
224 | PyDict_New(void) 
225 | { 
226 register PyDictObject *mp; 
/* 生成 对 象 的 操作 */ 
269 _Pyobject_GC_TRACK (mp) ; 
270 return (PyObject *)mp; 
271 | 





第 269 行 的 宏 _Py0bject_GC_TRACK() 负责 连接 链表 的 操作 。 这 次 同样 也 省 略 了 错误 检 
查 操作 。 


Include/objimpl.h 





261 | #define _Py0bject_GC_TRACK(o) do { \ 

262 PyGC_Head *g = _Py_AS_GC(0); \ 

265 g->gc.gc_refs = _PyGC_REFS_REACHABLE; \ 

266 g->gc.gc_next = _PyGC_generation0; \ 

267 g->gc.gc_prev = _PyGC_generation0->gc.gc_prev; \ 
268 g->gc.gc_prev->gc.gc_next = g; \ 

269 _PyGC_generation0->gc.gc_prev = g; \ 

270 } while (0); 
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在 这 个 安里 有 一 点 需要 大 家 注意 ， 那 就 是 第 261 行 到 第 270 行 用 do{...}while(0) 括 起 
来 的 地 方 。 这 里 不 是 为 了 循环 ， 而 是 写 宏 的 技巧 (或许 这 技巧 不 怎么 好 )， 这 样 一 来 涉及 多 个 
语句 的 操作 看 起 来 就 像 一 个 语句 了 。 读 代码 时 可 以 将 其 无 视 。 

那么 来 看 看 安 的 内 容 吧 。 首 先 从 对 象 取 出 用 于 循环 引用 垃圾 回收 的 头 。 第 262 行 的 安 
_Py_AS_GC() 的 定义 如 下 所 示 。 











Include/objimpl.h 
253 | #define _Py_AS_GC(o) ((PyGC_Head *) (0)-1) 


先 从 对 象 的 开头 地 址 开始 ， 将 头 地 址 偏 移 相应 的 大 小 ， 取 出 用 于 循环 引用 垃圾 回收 的 头 。 

接 下 来 把 _PyGC_REFS_REACHABLE 这 个 标志 存 人 成 员 gc_refs 中 。 这 个 标志 有 “程序 可 
能 到 达 的 对 象 ”的 意思 。 

最 后 拿 出 连接 了 所 有 容器 对 象 的 全 局 性 容器 对 象 链表 ， 把 对 象 连接 到 这 个 链表 。 我 们 在 第 
265 行 到 第 299 行进 行 这 项 操作 (关于 全 局 变量 _pyGC_generation0， 请 参考 10.10.6 节 )。 

这 样 一 来 就 把 所 有 容 吉 对象 都 连接 到 了 作为 容 需 对 象 链表 的 双向 链表 中 。 循 环 引用 垃圾 
回收 就 是 用 这 个 容器 对 象 链表 来 释放 循环 引用 对 象 的 。 
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图 10.30 追踪 容器 对 象 








10.10.5 ”结束 追踪 容器 对 象 

在 通过 引用 计数 法 释放 容器 对 象 之 前 ， 要 把 作为 对 象 的 容器 对 象 从 容器 对 象 链表 中 去 除 。 
因为 我 们 没 必要 去 追踪 已 经 释放 了 的 对 象 ， 所 以 这 么 做 也 是 理 所 应 当 的 。 

依然 以 字典 为 例 ， 下 面 是 释放 字典 的 函数 。 
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Objects/dictobject.c 
929 | static void 
930 | dict_dealloc(register PyDict0Object *mp) 
931|{ 
932 register PyDictEntry *ep; 
933 Py_ssize_t fill = mp->ma_fill; 
934 Py0bject_GC_UnTrack(mp); /* 追踪 结束 */ 
/* 字典 对 象 的 释放 操作 */ 
950 | ] 





这 里 用 第 934 行 的 Py0bject_GC_UnTrack() 函数 来 执行 结束 追踪 对 象 的 操作 。 


Modules/gcmodule.c 





1303 | void 

1304 | Py0bject_GC_UnTrack(void *op) 
1305 | { 

1309 if (IS_TRACKED(op) ) 

1310 _Pyogbject_GC_UNTRACK (op) ; 
1311 | } 




















用 宏 IS_TRACKED () 判断 对 象 是 不 是 正在 追踪 的 对 象 。 


Modules/gcmodule.c 
125 | #define IS_TRACKED(o) ((AS_GC(o))->gc.gc_refs != GC_UNTRACKED) 


宏 AS_GC() 是 之 前 讲 过 的 宏 _Py_AS_GC0 的 别名 ， 用 于 从 对 象 中 取出 用 于 循环 引用 垃圾 
回收 的 头 。 
如 果 是 正在 追踪 的 对 象 ， 就 结束 追踪 。 




















Include/objimpl.h 





276 | #define _PyObject_GC_UNTRACK(o) do { \ 

277 PyGC_Head *g = _Py_AS_GC(0); \ 

279 g->gc.gc_refs = _PyGC_REFS_UNTRACKED; \ 

280 g->gc.gc_prev->gc.gc_next = g->gc.gc_next; \ 
281 g->gc.gc_next->gc.gc_prev = g->gc.gc_prev; \ 
282 g->gc.gc_next = NULL; \ 

283 } while (0); 

















这 里 只 是 将 追踪 对 象 以 外 的 标志 (_PyGC_REFS_UNTRACKED) 存 人 成员 gc_refs， 并 从 容 
器 对 象 链表 中 去 除 而 已 。 
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顺便 一 提 ， 大 多 数 情况 下 都 是 通过 引用 计数 法 的 减 量 操作 来 释放 容器 对 象 的 。 因 为 通过 
循环 引用 垃圾 回收 释放 的 只 是 具有 循环 引用 关系 的 对 象 群 ， 所 以 数量 并 没有 那么 多 。 
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图 10.31 结束 追踪 容器 对 象 














10.10.6 “分 代 容 器 对 象 链表 
令 人 吃惊 的 是 ， 容 器 对 象 链表 分 为 3 代 。 没 错 ， 循 环 引用 垃圾 回收 事实 上 是 分 代 垃 圾 回 














有 些 读者 可 能 会 想 :“ 那 循环 引用 垃圾 回收 的 算法 原来 是 骗 人 的 吗 ?” 不 是 这 样 的 。 容 右 
对 象 链表 只 是 单纯 分 为 3 代 ， 要 做 的 事情 还 是 一 样 的 。 

这 些 容 吉 对 象 链表 分 别称 为 “0 代 ” “1 代 ”“2 代 ”。 

系统 通过 下 面 的 结构 体 来 管理 各 代 的 容器 对 象 链表 。 


























Modules/gcmodule.c 


37 | struct gc_generation { 


38 PyGC_Head head; 

39 int threshold; /* 开始 Gc 的 靖 值 */ 
40 int count; /* 该 代 的 对 象 数 */ 

42 | }; 


现在 将 容 需 对 象 连接 到 成 员 head。 

然后 对 成 员 threshold 设 定 启动 循环 引用 垃圾 回收 的 国 值 。 

在 需要 对 管理 的 那 一 代 执 行 GC 时 ， 成 员 count 是 不 可 或 缺 的 ， 它 决定 了 什么 时 候 执 行 
GC。 当 成 员 count 的 值 超过 了 成 员 threshold 的 阔 值 时 ， 程 序 就 对 这 一 代 执 行 GCC。 

代 不 同 ， 成 员 count 计数 的 对 象 也 不 同 ， 如 下 表 所 示 。 
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表 10.6 各 代 的 作用 
计数 对 象 (成 员 count ) 
生成 的 容器 对 象 的 数量 - 删除 的 容器 对 象 的 数量 





0 代 经 过 GC 的 次 数 
1 代 经 过 GC 的 次 数 














我 们 用 下 面 这 样 的 全 局 变量 来 初始 化 各 代 的 容 融 对 象 链表 。 





Modules/gcmodule.c 
45 | #define GEN_HEAD(n) (&generations[n] .head) 
46 
47 | /* linked lists of container objects */ 
48 | static struct gc_generation generations [NUM_GENERATIONS] = { 


49 /* PyGC_Head, threshold, count */ 
50 {{{GEN_HEAD(O0), GEN_HEAD(0), 0}}, 700 ， 0}+， 
51 {{{GEN_HEAD(1), GEN_HEAD(1), 0}}, 40 0}; 
52 {{{GEN_HEAD(2), GEN_HEAD(2), 0}}, L060 0}., 
53| 小 ; 











至 于 各 代 的 PyGC_Head， 双 向 链表 是 以 引用 自身 的 形式 被 初始 化 的 。 另 外 , 成员 gc_ 
refs 当然 为 0。 
在 这 里 来 讲 一 下 在 10.10.4 节 没 有 解说 的 全 局 变量 _PyGC_generation0 吧 。 


Modules/gcmodule.c 
55 | PyGC_Head *_PyGC_generation0 = GEN_HEAD(0O) ; 














这 是 0 代 的 容器 对 象 。 

一 开始 所 有 的 容器 对 象 都 连接 着 0 代 的 对 象 。 此 外 ， 从 新 生 代 到 老年 代 ， 只 有 经 过 循环 
引用 垃圾 回收 活 下 来 的 容 絮 对 象 才能 够 晋升 。 也 就 是 说 ，1 代 的 容 需 对 象 链表 里 装 的 是 活 过 
了 1 次 循环 引用 垃圾 回收 的 对 象 ，2 代 的 容 需 对 象 链表 里 装 的 是 活 过 了 2 次 循环 引用 垃圾 回 
收 的 对 象 。 
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图 10.32 分 代 容 器 对 象 链表 


10.10.7 何 时 执行 循环 引用 垃圾 回收 


从 内 部 来 说 ， 在 生成 容 需 对 象 的 时 候 执行 循环 引用 垃圾 回收 。 关 于 生成 对 象 的 操作 我 们 
之 前 已 经 讲 过 了 ， 这 里 就 不 再 袭 述 了 。 


Modules/gcmodule.c 




















1320 | PyObject * 
1321 | _PyObject_GC_Malloc(size_t basicsize) 
1322:| 蒜 
1323 PyObject *op; 
1324 PyGC_Head *g; 

/* 生成 对 象 的 操作 */ 

/* 对 分 配 的 对 象 数 进行 增 量 操作 */ 
1332 generations [0] .count++; 
1333 if (generations [0] .count > generations [0] .threshold && 
1334 enabled && 
1335 generations[0] .threshold && 
1336 Icollecting && 
1337 !PyErr_0ccurred()) { 
1338 collecting = 1; 
1339 collect_generations(); 
1340 collecting = 0; 
1341 } 
1342 op = FROM_GC(g); 
1343 return op; 
1344 | } 
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在 第 1332 行 对 0 代 的 成 员 count 执行 增 量 操作 。 
接 下 来 检查 是 否 能 执行 循环 引用 垃圾 回收 。 首 先 在 第 1333 行 检查 0 代 的 count 有 没有 
超过 设 定 的 国 值 。 


然后 在 第 1334 行 确认 全 局 变量 enabled 是 0 以 外 的 数值 。 这 








个 变量 准备 了 可 以 从 


Python 水 准 操作 的 API。 只 有 在 用 户 不 想 运行 循环 引用 垃圾 回收 时 ， 这 个 变量 的 值 才 会 为 0。 
下 面 在 第 1335 行 确认 threshold 不 为 0， 在 第 1336 行 确 认 循 环 引 用 垃圾 回收 是 否 正 在 


执行 。 最 后 用 PyErr_0ccurred() 函数 来 检查 有 没有 发 生 异 党 。 


如 果 这 些 检查 全 都 合格 ， 就 执行 循环 引用 垃圾 回收 。 


在 运行 循环 引用 垃圾 回收 时 ，); 








各 全 局 变量 collecting 设 为 1( 正 在 执行 G6C), 调用 


collect_generations() 函数 。 这 就 是 调用 循环 引用 垃圾 回收 的 部 分 。 
因为 collect_generations() 函数 很 简单 ， 就 顺便 一 起 来 看 看 吧 。 


Modules/gcmodule.c 


882 
883 
884 
885 
886 


891 
892 
893 
894 
895 
896 
897 
898 





static Py_ssize_t 


collect_generations(void) 


4 


} 


Eo rs hs 


Py_ssize_t n = 0; 


for (i = NUM_GENERATIONS-1; i >= 0; i--) { 


if (generations[i].count > generations[i].threshold) { 





日 垃圾 





na = collect(i); /* 执行 循环 引 月 
break ; 
} 
} 


return n; 





0 








收 ! 


*/ 


在 这 里 检查 各 代 的 计数 器 和 浆 值 ， 对 超过 阔 值 的 代 执 行 GCC， 这样 一 来 循环 引用 垃圾 回 


收 的 所 有 内 容 就 都 装 人 了 程序 调用 的 collect() 函数 里 。 


10.10.8 ”循环 引用 垃圾 回收 
那么 来 看 一 下 collect() 函数 。 这 个 函数 实现 起 来 非常 简单 ， 也 很 容易 看 懂 ( 跟 


Py0bject_Malloc() 大 相 径 庭 )。 这 次 也 略 去 了 debug 处 理 等 部 分 。 


Modules/gcmodule.c 


732 
733 
734 
735 
738 


static Py_ssize_t 


collect(int generation) 


{ 


ko 


PyGC_Head *young; /* 即将 查找 的 一 代 */ 


739 
740 
741 


762 
763 
764 
765 
766 
767 
768 
769 
770 
TE 
772 
773 
774 
775 
776 
TE 
778 


785 


786 


794 


795 


798 


799 


808 
809 
814 


834 


865 


880 
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] 的 垃圾 对 象 














PyGC_Head *old; /* 下 一 代 */ 
PyGC_Head unreachable; /* 无 异样 不 能 到 达 对 象 的 链表 */ 
PyGC_Head finalizers; 





/* 更 新 计数 器 */ 

if (generation+1 < NUM_GENERATIONS) 
generations [generation+1l] .count += 1; 

for (i = 0; i <= generation; i++) 


generations[i] .count = 0; 


/* 合并 指定 的 代 及 其 以 下 的 代 的 链表 */ 
for (i = 0; i < generation; i++) { 
gc_list_merge(GEN_HEAD(i), GEN_HEAD (generation)); 


/* 给 old 变 量 赋值 */ 
young = GEN_HEAD (generation); 
if (generation < NUM_GENERATIONS-1) 











old = GEN_HEAD(generation+1); 
else 
old = young; 
update_refs(young); /* 把 引用 计数 器 复制 到 用 于 循环 引用 垃圾 回收 的 头目 























*/ 


蔬 


subtract_refs(young); /* 删除 实际 的 引 月 








/* 将 计数 器 值 为 0 的 对 象 移动 到 不 可 能 到 达 对 象 的 链表 */ 
gc_list_init(&unreachable); 
move_unreachable(young, &unreachable); 

/* 将 从 循环 引用 垃圾 回收 中 幸存 的 对 象 移动 到 下 一 代 */ 
if (young != old) 

















gc_list_merge(young, o01d); 





/* 移出 不 可 能 到 达 对 象 的 链表 内 有 终结 器 的 对 象 */ 
gc_list_init(&finalizers); 
move_finalizers(&unreachable, &finalizers); 


move_finalizer_reachable(&finalizers); 








/* 释放 循环 引用 的 对 象 群 */ 


delete_garbage(&unreachable，old) ; 











/* 将 finalizers 链 表 注 册 为 “不 能 释放 的 垃圾 ”*/ 


(void)handle_finalizers(&finalizers，old) ; 


已 */ 
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首先 对 一 个 老年 代 的 计数 器 执行 增 量 操作 ， 将 所 指定 的 代 的 计数 融 值 设 为 0。 之 后 将 所 


站 定 的 代 及 其 以 下 代 的 链表 合并 到 自己 所 





属 的 代 中 。 


然后 把 引用 计数 噩 复制 到 用 于 循环 引用 垃圾 回收 的 头 里 ， 从 这 个 计数 需 删 除 实际 的 引用 。 
这 样 一 来 ， 正 如 之 前 在 10.10.1 节 中 提 到 的 那样 ， 循 环 引用 的 对 象 的 计数 需 值 会 变 为 0， 


所 以 要 将 其 存 人 不 可 能 到 达 对 象 的 链表 。 


之 后 把 从 GC 中 幸存 下 来 的 对 象 连同 链表 一 起 合并 到 下 一 代 ， 证 代 晋 升 。 

因为 某 些 原因 ， 程 序 无 法 释放 有 终结 需 的 循环 引用 的 垃圾 对 象 ， 所 以 要 将 其 移出 。 

最 后 只 要 将 不 可 能 到 达 对 象 的 链表 里 的 对 象 全 部 释放 ， 就 完全 释放 了 循环 引用 的 对 象 群 。 
我 们 把 collect () 函数 分 成 了 儿 个 简明 易 懂 且 大 小 适当 的 函数 ， 大 家 应 该 非常 容易 理解 吧 。 
不 过 光 说 这 些 感觉 还 不 够 ,下 面 就 让 我 们 一 起 来 看 看 各 自 调用 的 函数 吧 。 


10.10.9 gc_list_merge() 
这 个 函数 负责 执行 合并 双向 链表 的 操作 。 








Modules/gcmodule.c 





187 | static void 

188 | gc_list_merge(PyGC_Head *from, PyGC_Head *to) 
189|{ 

190 PyGC_Head *tail; 

191 assert (from != to); 

192 if (!gc_list_is_empty(from)) { 

193 tail = to->gc.gc_prev; 

194 tail->gc.gc_next = from->gc.gc_next; 
195 tail->gc.gc_next->gc.gc_prev = tail; 
196 to->gc.gc_prev = from->gc.gc_prev; 
197 to->gc.gc_prev->gc.gc_next = to; 

198 } 

199 gc_list_init(from); 

200|3} 

















事实 上 执行 起 来 很 简单 ， 就 是 把 from 链表 连接 到 to 链表 的 末尾 。 


10.10.10 _ update_refsb 
这 个 函数 负责 把 引用 计数 器 的 值 复制 到 容器 对 象 链表 内 对 象 的 所 有 gc_refs 成 员 里 。 


Modules/gcmodule.c 
238 | static void 
239 | update_refs(PyGC_Head *containers) 
240 | { 


241 PyGC_Head *gc = containers->gc.gc_next; 


242 for (; gc != containers; gc = gc->gc.gc_next) { 


244 
264 
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gc->gc.gc_refs = Py_REFCNT(FROM_GC(gc)); 


265 | } 


里 查找 所 有 容 需 对 象 链表 ， 复 制 引用 计数 需 。 


10.10.11 subtract_refs() 


这 


个 函数 负责 查找 所 有 容器 对 象 链表 的 引用 ， 减 去 找到 的 容 右 对 象 的 成 员 gc_refs 的 计 


数 融 值 。 


Modules/gcmodule.c 


290 
291 
292 
293 
294 
295 
296 
297 
298 
299 
300 
301 





static void 


subtract_refs(PyGC_Head *containers) 


二 
traverseproc traverse; 
PyGC_Head *gc = containers->gc.gc_next; 
for (; gc != containers; gc=gc->gc.gc_next) { 
traverse = Py_TYPE(FROM_GC(gc))->tp_traverse; 
(void) traverse (FROM_GC(gc), 
(visitproc)visit_decref, 
NULL); 
上 


在 这 里 对 容 右 对 象 链表 内 的 所 有 对 象 调用 traverse() 困 数 。 
这 个 函数 在 开发 模式 中 活用 了 访问 者 模式 中 3。 第 296 行 的 成 员 tp_traverse 内 存 有 各 
个 型 特有 的 遍历 也 数 。 打 个 比方 ， 链 表 的 情况 下 就 是 以 下 也 数 。 








Objects/listobject.c 


2158 
2159 
2160 
2161 
2162 
2163 
2164 
2165 
2166 





static int 


list_traverse(PyListObject *o, visitproc visit, void *arg) 


{ 
Py_ssize_t i; 
for (i = Py_SIZE(o); --i >= 0; ) 
Py_VISIT(o->ob_item[i]) ; 
return 0 |; 
机 


对 链表 内 的 所 有 元 素 调用 宏 Py_VISIT() 。 
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Include/objimpl.h 


303 | #define Py_VISIT(op) \ 
304 do \ 
305 if (op) { \ 
306 int vret = visit((PyObject *) (op), arg);\ 
307 if (vret) \ 
308 return vret; \ 
309 * \ 
310 } while (0) 








在 宏 Py_VISIT() 中 ， 对 参数 op 调用 visit。 这 个 visit 是 作为 参数 传递 给 list_traverse() 
函数 的 。 此 外 ,在 这 里 把 arg 也 一 起 作为 visit 的 参数 传递 给 1ist_traverse() 函数 。 

这 样 一 来 ， 遍 历 函 数 就 能 对 所 有 保留 其 型 的 对 象 调用 指定 的 函数 。 在 这 种 情况 下 ， 这 就 
意味 着 调用 visit_decref() 函数 。 

当 要 访问 的 函数 和 被 访问 的 函数 都 作为 组 件 并 需要 替换 时 ， 可 以 采用 访问 者 模式 。 在 这 
种 情况 下 ， 被 访问 的 函数 是 遍历 函数 。 我 们 必须 用 各 种 各 样 的 函数 蔡 换 过 历 函 数 ， 如 元 组 用 
的 函数 、 字 典 用 的 函数 等 。 当 然 ， 根 据 不 同 的 用 途 ， 也 必须 能 够 更 改 要 访问 的 函数 。 因 此 才 
在 这 里 使 用 访问 者 模式 。 笔 者 认为 这 是 一 个 相当 不 错 的 使 用 范例 。 对 了 ,在 之 后 的 章节 中 也 
会 经 常 出 现 访 问 者 模式 ,请 大 家 务必 牢记 。 

下 面 让 我 们 回 到 正题 ， 来 看 看 visit_decref() 函数 吧 。 














Modules/gcmodule.c 


268 | static int 

269 | visit_decref (PyObject *op, void *data) 
27@| 入 

人 7 业 assert(op != NULL); 

272 if (PyObject_IS_GC(op)) { 

273 PyGC_Head *gc = AS_GC(op); 
279 if (gc->gc.gc_refs > 0) 
280 gc->gc .gc_refs--; 

281 } 

282 return 0; 

283 | 上 





链表 的 情况 下 ， 这 个 函数 的 参数 op 变 成 了 链表 内 的 元 素 。 因 为 已 经 被 链表 引用 了 ， 所 
以 需要 对 这 个 对 象 的 成 员 gc_refs 执行 减 量 操作 。 
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10.10.12 move_unreachable() 


YY 


这 个 函数 负责 把 循环 引用 的 对 象 群 移动 到 不 可 能 到 达 对 象 的 链表 。 


Modules/gcmodule.c 


[i 
ZE 


对 象 还 有 可 能 被 移出 unreachable 链表 。 


354 
355 
356 
357 
367 
368 
369 
370 
371 
380 
381 
383 
384 
385 
386 
387 
388 
389 
397 
398 
399 
400 
401 
402 
403 


这 里 使 用 while 语 





static void 


move_unreachable (PyGC_Head *young, PyGC_Head *unreachable) 


{ 


PyGC_Head *gc = young->gc.gc_next; 


while (gc != young) { 
PyGC_Head *next; 


if (gc->gc.gc_refs) { 


PyObject *op = FROM_GC(gc); 
traverseproc traverse = Py_TYPE(op)->tp_traverse; 
gc->gc.gc_refs = GC_REACHABLE; 


(void) traverse(op， 


(visitproc)visit_reachable, 


(void *)young); 


next = gc->gc.gc_next; 
} 
else { 


next = gc->gc.gc_next; 


gc_list_move(gc, unreachable); 
gc->gc.gc_refs = GC_TENTATIVELY_UNREACHABLE; 


} 


gc = Dext ; 


} 


名 遍历 young 的 容 带 对 象 链表 。 


首先 从 if 语句 的 else ee 当 对 象 的 成 员 gc_refs 为 0 时， 需要 把 对 象 移 
动 到 unreachable( 不 可 能 到 达 ) 链表 ， 





unreachable( 不 可 能 到 达 ) 链表 移出 。 
接 下 来 该 谈 谈 对 象 的 成 员 gc_refs 不 为 0 时 的 情况 了 。 这 时 候 要 给 gc_refs 设置 标志 


GC_REACHABLE， 它 的 意思 是 “活动 对 象 ”， 




















调用 visit_reachable() 国 数 。 


合 gc_ refs 设置 标志 GC_TENTATIVELY_UNREACHABLE， 


意思 是 “总 之 先 放 到 不 可 能 到 达 对 象 的 链表 里 ”。 为 什么 要 设 定 这 个 标志 呢 ? 因为 这 个 时 候 


举 个 例子 ， 如 果 对 象 有 终结 器 ， 那 么 就 要 将 其 从 








也 就 是 非 循环 引用 。 然 后 使 用 访问 者 的 遍历 函数 
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Modules/gcmodule.c: 省 略 检查 操作 


304 | static int 

305 | visit_reachable(PyObject *op, PyGC_Head *reachable) 
306 | 

307 if (PyObject_IS_GC(op)) { 

308 PyGC_Head *gc = AS_GC(op); 

309 const Py_ssize_t gc_refs = gc->gc.gc_refs; 
310 

311 if (gc_refs == 0) { 

317 gc->gc.gc_refs = 1; 

318 } 

319 else if (gc_refs == GC_TENTATIVELY_UNREACHABLE) { 
326 gc_list_move(gc, reachable); 

327 gc->gc.gc_refs = 1; 

328 a 

342 } 

343 return 0; 

344 | } 





如 果 gc_refs 为 0， 就 将 其 设 定 为 1， 以 准确 表示 引用 关系 。 

如 果 gc_refs 是 GC_TENTATIVELY_UNREACHABLE， 说 明 里 面 已 经 存 人 了 非 活动 对 象 ， 所 
以 就 必须 把 它们 从 里 面 救 出 来 。 这 里 我 们 将 其 移动 到 reachable 链表 (young 的 容 带 对 象 链表 )， 
将 gc_refs 设置 为 1。 





10.10.13 move_finalizers() 


这 个 函数 的 作用 是 移出 那些 容器 对 象 链表 内 有 终结 器 的 非 活 动 对 象 。 至 于 为 什么 要 移出 ， 
我 们 会 在 之 后 的 10.10.17 节 为 大 家 解说 。 





Modules/gcmodule.c 





419 | static void 

420 | move_finalizers (PyGC_Head *unreachable, PyGC_Head +*finalizers) 
421|{ 

422 PyGC_Head *gc; 

423 PyGC_Head *next; 

424 

428 for (gc = unreachable->gc.gc_next; gc != unreachable; gc = next) { 
429 PyObject *op = FROM_GC(gc); 

430 

432 next = gc->gc.gc_next; 

433 

434 if (has_finalizer(op)) { 
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435 gc_list_move(gc, finalizers); 
436 gc->gc.gc_refs = GC_REACHABLE; 
437 二 

438 BB 

439 | } 





这 里 没有 什么 需要 特别 说 明 的 地 方 。 只 是 遍历 unreachable 链表 ， 把 有 终结 器 的 对 象 移 
到 finalizers 链表 而 已 。 


10.10.14 move_ finalizer_reachable() 


这 个 函数 负责 从 已 经 移出 的 有 终结 需 的 对 象 开始 往 下 查找 ， 移 出 该 对 象 引 用 的 对 象 。 执 
行 这 项 操作 是 为 了 在 最 终 化 的 时 候 不 发 生 “ 保 留 的 对 象 被 释放 了 ”的 情况 。 








Modules/gcmodule.c 


458 
459 
460 
461 
462 
463 
465 
466 
467 
468 
469 
470 





static void 


move_finalizer_reachable (PyGC_Head *finalizers) 


二 
traverseproc traverse; 
PyGC_Head *gc = finalizers->gc.gc_next; 
for (; gc != finalizers; gc = gc->gc.gc_next) { 
traverse = Py_TYPE(FROM_GC(gc))->tp_traverse; 
(void) traverse (FROM_GC(gc), 
(visitproc)visit_move, 
(void *)finalizers); 
} 
3 


这 里 访问 者 模式 也 发 挥 了 很 大 的 作用 。 


Modules/gcmodule.c 


442 
443 
444 
445 
446 
447 
448 
449 
450 
451 
452 
453 





static int 

visit_move(Py0bject *op, PyGC_Head *tolist) 

{ 

if (PyObject_IS_GC(op)) { 
if (IS_TENTATIVELY_UNREACHABLE(op)) { 

PyGC_Head *gc = AS_GC(op); 
gc_list_move(gc, tolist); 
gc->gc.gc_refs = GC_REACHABLE; 


} 


return 0; 
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这 里 做 的 只 是 把 对 象 保存 到 finalizers 链表 而 已 。 


10.10.15_delete_garbageb 
下 面 终 于 要 用 这 个 函数 来 释放 循环 引用 对 象 群 了 。 


Modules/gcmodule.c 


668 | static void 

669 | delete_garbage (PyGC_Head *collectable, PyGC_Head *old) 
670|{ 

671 inquiry clear; 

672 

673 while (!gc_list_is_empty(collectable)) { 

674 PyGC_Head *gc = collectable->gc.gc_next; 

675 PyObject *op = FROM_GC(gc); 

682 if ((clear = Py_TYPE(op)->tp_clear) != NULL) { 
683 Py_INCREF (op) ; 

684 clear (op); 

685 Py_DECREF (op) ; 

686 上 

688 if (collectable->gc.gc_next == gc) { 

690 gc_list_move(gc, o01d); 

691 gc->gc.gc_refs = GC_REACHABLE; 

692 二 

693 } 

694|} 

















首先 在 第 682 行 获得 各 个 型 的 clear() 函数 。clear() 函数 是 清除 对 象 内 容 的 函数 。 打 
个 比方 ， 在 链表 中 就 有 对 元 素 内 的 对 象 执行 减 量 操 作 ， 并 将 其 从 链表 中 去 除 的 函数 。 

然后 在 第 683 行 对 对 象 执行 一 次 增 量 操作 。 考 虑 到 释放 对 象 是 循环 引用 的 对 象 群 ， 可 能 
会 因为 clear() 函数 的 连锁 反应 造成 自身 被 消除 ， 为 了 避免 出 现 这 种 情况 ， 在 调用 clear() 
函数 之 前 先 执行 增 量 操作 ， 之 后 再 调用 clear() 函数 。 

然后 马上 进行 减 量 操作 。 在 进行 此 项 操作 时 ， 按 理 说 对 象 的 引用 计数 器 值 会 变 成 0， 对 

会 得 到 释放 。 

不 过 ， 也 有 可 能 因为 某 种 原因 导致 对 象 无 法 得 到 释放 (大 多 数 情况 下 是 出 现 了 忘记 执行 
减 量 操作 等 BUG )。 第 688 行 到 第 691 行 的 代码 考虑 到 了 这 种 情况 。 

如 果 用 减 量 操作 释放 了 对 象 ,， 那么 collectable->gc.gc_next 所 指向 的 对 象 应 该 与 之 
前 不 同 。 利 用 这 一 点 ， 如 果 collectable->gc.gc_next 所 指向 的 对 象 与 之 前 一 样 ， 就 将 这 
个 对 象 视 为 尚未 被 释放 的 对 象 ( 也 就 是 说 这 个 对 象 是 活动 对 象 )， 并 返回 原来 的 容器 对 象 链表 。 
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10.10.16 nandle na Eesti 
在 这 个 函数 中 对 全 局 变量 garbage 注册 之 前 保存 的 finalizers 链表 。 


Modules/gcmodule.c 


641 | static int 
642 | handle_finalizers(PyGC_Head *finalizers，PyGC_Head *old) 
643 | 并 
644 PyGC_Head *gc = finalizers->gc.gc_next; 
645 
646 if (garbage == NULL) { 
647 garbage = PyList_New(0); 
648 if (garbage == NULL) 
649 Py_FatalError("gc couldn't create gc.garbage list"); 
650 3 
651 for (; gc != finalizers; gc = gc->gc.gc_next) { 
652 PyObject *op = FROM_GC(gc); 
653 
if (has_finalizer(op)) { 
655 if (PyList_Append(garbage, op) < 0) 
656 return -1; 
657 } 
658 } 
659 
660 gc_list_merge(finalizers, 01d); 
661 return 0; 
662 | 上 




















使 用 PyList_New() 函数 给 garbage 赋值 ， 这 一 点 就 证 明了 它 是 在 Python 中 处 理 的 变量 。 
事实 上 为 了 能 从 Python 水 准 处 理 全 局 变量 garbage， 开 发 者 准备 了 相应 的 API。 


import gc 


gc.garbage # [] 




















上 述 代 码 是 在 Python 中 取出 变量 garbage 的 简单 代码 。 代 码 中 的 import 是 用 于 读 取 郴 


a 在 这 里 它 的 意 


这 个 handle_finalizers()PE 


10.10.17 循环 引用 中 





思 是 “ 读 取 gc 模块 "。 之 后 只 要 一 调用 gc.garbage， 就 能 访问 用 
函数 注册 的 对 象 。 


终结 器 的 问题 





循环 引用 垃圾 回收 把 带 有 终结 天 的 对 象 排 除 在 处 理 范 围 之 外 ， 这 是 为 什么 呢 ? 
事实 上 ， 想 要 释放 循环 引用 的 有 终结 噩 的 对 象 是 非常 麻烦 的 。 

















举 个 例子 ， 假 设 两 个 对 象 是 互相 引用 (循环 引用 ) 的 关系 ， 如 果 它 们 分 别 持 有 自己 的 终 


结 咒 ， 那 么 先 调 用 哪个 才 好 呢 ? 
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| 用 第 2 个 对 象 


第 1 个 对 象 














T 
二 








应 该 先 调用 哪个 的 终结 器 ? 
10.33 ”循环 引用 对 象 的 终结 器 


在 将 第 1 个 对 象 最 终 化 后 ， 如 果 想 将 第 2 个 对 象 最 终 化 ,那么 或 许 会 在 最 终 化 过 程 中 引 
用 到 第 1 个 对 象 。 也 就 是 说 ， 在 这 种 情况 下 是 无 法 释放 (无 法 最 终 化 ) 第 1 个 对 象 的 。 从 理 
论 上 来 说 这 看 似 很 矛盾 ， 不 过 反 过 来 想 ， 最 后 还 是 会 得 出 一 样 的 结论 。 

因为 这 个 问题 没有 解决 的 办 法 ， 所 以 在 循环 引用 垃圾 回收 中 ， 有 终结 噩 的 循环 引用 垃圾 
对 象 是 排除 在 GC 的 对 象 范围 之 外 的 。 

相反 地 ， 有 终结 需 的 循环 引用 对 象 能 够 作为 链表 在 Python 内 进行 处 理 。 前 面 提 到 的 变 
量 garbage 就 是 这 样 。 如 果 出 现 有 终结 需 的 循环 引用 垃圾 对 象 ， 我 们 就 需要 利用 这 项 功能 ， 
从 应 用 程序 的 角度 来 去 除 对 象 的 循环 引用 。 


10.10.18 不 需要 写 入 屏障 吗 


循环 引用 垃圾 回收 虽然 是 分 代 垃圾 回收 ， 但 它 并 不 需要 写 入 屏障 。 

写 和 屏障 是 一 个 用 于 记录 从 老年 代 指 向 新 生 代 的 引用 的 机 制 。 要 说 为 什么 需要 记录 ， 那 
是 为 了 防止 出 现 偏差 一 一 被 认 作 垃 圾 的 新 生 代 对 象 其 实 是 老年 代 引 用 的 活动 对 象 。 

然而 在 循环 引用 垃圾 回收 中 ， 即 使 记录 了 来 自 于 老年 代 的 引用 也 没有 任何 意义 。 

事实 上 即使 不 加 入 写 和 屏障， 程序 也 已 经 通过 引用 计数 法 把 从 老年 代 的 引用 切实 记录 到 
每 个 对 象 了 。 想 必 大 家 还 记得 吧 ， 循 环 引用 垃圾 回收 中 首先 将 引用 计数 需 复 制 到 了 成 员 gc_ 
refs 里 。 

在 Python 的 循环 引用 垃圾 回收 中 ,我 们 按照 对 象 的 被 引用 数量 对 成 员 gc_refs 执行 了 
减 量 操作 ， 并 将 变 成 0 的 成 员 看 作 循环 引用 的 对 象 群 。 另 外 ， 对 于 从 老年 代 的 引用 ， 不 会 对 
gc_refs 减 量 。 也 就 是 说 ， 这 个 对 象 的 gc_refs 绝对 不 会 为 0， 该 对 象 肯定 会 被 看 作 活动 对 象 。 
因此 ， 即 使 没有 写 和 人 屏障 也 不 会 出 现 差错 。 
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A 和 性 能 调整 的 建议 


在 本 章 最 后 ， 我 们 来 谈 一 下 PythonGC 的 性 能 调整 的 相关 内 容 。 


10.11.1 _ gc.set_debug() 

GC 常 有 的 一 个 问题 就 是 “应 用 程序 无 响应 ”。 特 别 是 对 于 像 游戏 这 种 重视 实时 性 的 应 用 
程序 而 言 ， 这 就 是 个 非常 严重 的 大 问题 了 。 

因为 Python 的 垃圾 回收 采用 的 是 引用 计数 法 ， 所 以 基本 上 不 会 出 现 应 用 程序 无 响应 的 
情况 。 然 而 循环 引用 垃圾 回收 在 某 种 程度 上 要 花 掉 相当 多 的 时 间 ， 所 以 也 难免 会 出 现 应 用 无 
响应 的 情况 。 

在 这 种 情况 下 ， 首 先 要 使 用 gc 模块 的 set_debug() 来 查找 原因 。 






































import gc 

gc.set_dqebug(gc.DEBUG_STATS) 

gc.collect() 

# gc: collecting generation 2... 

# gc: objects in each generation: 10 0 13607 
# gc: done, 0.0087s elapsed. 


一 旦 用 set_debug() 设 定 了 gc.DEBUG_STATS 标志 ,那么 每 次 进行 循环 引用 垃圾 回收 ， 
就 都 会 输出 以 下 信息 。 


1. GC 对 象 的 代 
2. 各 代 内 对 象 的 数量 
3. 循环 引用 垃圾 回收 所 花费 的 时 间 








除了 DEBUG_STATS 以 外 ， 还 可 以 在 set_debug() 里 设 定 各 种 各 样 的 标志 。 关 于 这 些 标 
志 各 自 的 含义 在 gc 模块 的 参考 文档 由 中 已 经 有 详细 记载 ， 请 大 家 查阅 这 部 分 。 


10.11.2 gc.collect() 
如 果 调 查 了 原因 并 进行 了 改善 ， 结 果 还 是 无 响应 的 话 ， 这 时 候 可 能 就 要 用 到 gc .collect () 了 。 
使 用 gc.collect() 的 话 ， 就 能 在 应 用 程序 运行 过 程 中 的 任意 时 刻 执行 循环 引用 垃圾 回 
收 了 。 也 就 是 说 ， 这 样 一 来 就 可 以 在 应 用 程序 空闲 或 者 等 待 执行 的 期 间 执行 GCC 了。 














GD gc 模块 的 文档 : http://www.python.jp/doc/release/lib/module-gc.html。 
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如 果 还 不 行 ， 就 干脆 用 gc.disable() 试 坛 吧 ， 这 也 是 一 种 手段 。 

一 旦 调用 gc.disable() ， 循 环 引用 垃圾 回收 就 停止 运作 了 。 也 就 是 说 ， 循 环 引用 的 垃 
圾 对 象 群 一 直 不 会 得 到 释放 。 

然而 从 应 用 程序 整体 的 角度 来 看 ， 如 果 循 环 引用 的 对 象 的 大 小 可 以 忽视 ， 那 么 这 个 方法 
也 不 失 为 一 个 好 方法 。 这 就 需要 我 们 自己 来 权衡 了 。 








DalvikVM 的 垃圾 回收 





本 章 将 为 大 家 介绍 DalvikVM 的 垃圾 回收 。 说 到 DalvikVM 大 家 或 许 不 熟悉 ， 但 如 果 
说 “Google 手机 ”上 搭载 的 VM ， 大 家 就 该 有 印象 了 吧 。 


aN 
/ 


必 局 量 本 章 前 言 


在 讲 DalvikVM 之 前 ， 首 先 来 说 说 Android 吧 。Android 的 源 代码 中 经 常 出 现 Android 平 
台 固 有 的 代码 。 在 看 源 代 码 之 前 ， 我 们 需要 事先 了 解 这 些 信息 。 


11.1.1 ”什么 是 Android 


Android 是 Google 公司 发 布 的 手机 平台 的 名 称 。 

Android 包含 手机 0S、 通 讯 录 之 类 的 基本 应 用 程序 ， 以 及 窗口 管理 需 之 类 的 中 间 件 等 软 
件 群 ， 作 为 首 个 免费 的 移动 平台 ， 它 备 受 瞩目 。 

大 家 第 说 的 “Google 手机 ” 指 的 就 是 搭载 了 Android 平台 的 “Android 终端 "。 日 本 也 于 
2009 年 7 月 10 日 通过 NTT DOCOMO0O9 发 售 了 型 号 为 HT-032 的 Google 手机 。 




































































GD NTT DOCOMO 是 日 本 的 一 家 电信 公司 ， 是 日 本 最 大 的 移动 通信 运营 商 ， 拥 有 超过 6 千 万 的 签约 用 户 。 译 者 注 
@ HT-03A: http://www.nttdocomo.co.jp/product/foma/pro/ht03a/。 
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11.1.2 ”Android 架构 
Android 的 结构 如 下 图 所 示 。 





应 用 程序 杠 


DalvikVM 











Linux 内 核 











F (Android 终端 ) 


图 11.1 Android 架构 


Android 平台 中 ， 在 和 图 11.1 最 下 方 的 硬件 进行 交互 时 使 用 Linux 内 核 。 其 上 方 有 中 间 件 ， 
那里 有 libe 和 SQLite 等 函数 库 。 

然后 再 往 上 是 DalvikyVM， 它 是 这 次 的 主角 。 在 Android 平台 上 运行 的 应 用 程序 原则 上 都 
是 在 这 个 DalvikVM 中 运行 的 。 

应 用 程序 框架 中 含有 包 管 理 器 和 窗口 管理 器 等 。 

再 往 上 看 ， 最 上 方 是 应 用 程序 。Android 应 用 利用 应 用 框架 实现 其 功能 。 用 户 看 到 的 电 
话 本 和 Web 浏览 器 等 应 用 都 位 于 这 里 。 

Android 应 用 的 描述 语言 是 Java。jJava 的 源 代 码 最 终 会 被 输出 为 用 于 DalvikVM 的 字 节 码 。 
DalvikVM 会 执行 输出 的 字 节 人 码 ,， 在 Android 平台 上 运行 应 用 程序 。 


11.1.3 DalvikVM 的 特征 


DalvikVM 是 由 Dan Bornstein 及 Coogle 公司 的 工程 师 开 发 的 。Dalvik 这 个 独特 的 名 字 来 
源 于 原 开 发 者 Dan 的 祖先 所 居住 的 一 个 小 渔村 ， 渔 村 位 于 冰岛 的 Eyjafj6raur( 意 思 是 “ 冰 马 
峡 湾 ”)， 渔 村 的 名 字 叫 Dalvik (意思 是 “山谷 中 的 港湾 ”)。 

DalvikVM 解释 和 执行 的 字 节 码 和 Sun 公司 的 JVM (Java 虚拟 机 ) 解 释 和 执行 的 字 节 码 
没有 兼容 性 。DalvikVM 解释 和 执行 的 字 节 码 被 称 为 Dalvik Executable( 扩 展 名 为 dex)。 通 
过 修改 Sun 提供 的 Java 编译 器 输出 的 Java 类 文件 (扩展 名 为 class)， 就 可 以 得 到 Dalvik 
Executable。 修 改过 程 中 则 使 用 Android SDK 所 包含 的 工具 dx。 

为 了 收集 必要 的 型 信息 和 方法 (method) 信 息 ， 这 个 .dex 文件 要 比 通常 的 .class 文件 小 。 
这 样 一 来 导入 到 Android 终端 的 应 用 程序 的 体积 就 会 变 小 ， 我 们 就 能 有 效率 地 使 用 有 限 的 资源 。 

此 外 ，DalvikVM 的 设计 目标 之 一 就 是 在 运作 时 尽 可 能 地 节约 内 存 。 因 为 Android 终端 是 
受 内 存 限制 的 ， 所 以 这 人 么 设计 可 以 说 是 理所当然 的 。 


















































































































































11.1.4 ”Android 是 多 任务 的 
Android 的 应 用 程序 支持 多 任务 操作 。 例 如 可 以 在 浏览 网 页 的 同时 记 笔记 、 


写 邮 件 等 ， 很 方便 。 
令 人 吃惊 的 是 ， 每 个 应 用 程序 都 运行 得 很 流畅 ， 基 本 上 不 会 出 现 程序 卡 顿 的 情况 ， 因 此 


人 们 很 在 意 它 的 实现 。 在 Android 平台 上 是 如 何 实现 多 任务 的 呢 ? 
始 启动 时 会 启动 一 个 叫 作 Zygote 的 进程 。Zygote 这 个 进程 是 所 有 Android 
应 用 程序 的 父 进程 ， 每 当 启动 一 个 应 用 程序 的 时 候 ，Zygote 就 会 fork 出 一 个 子 进 程 。 

因为 Zygote 有 很 多 函数 库 ， 所 以 启动 要 花 一 段 时 间 ， 不 过 一 旦 完成 启动 ， es 
地 生成 子 进 程 了 。 此 外 ， 因 为 子 进程 和 父 进程 共用 一 块 内 存 空间 ， 所 以 内 存 消耗 量 也 减少 





边 看 地 图 边 
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所 有 应 用 程序 的 父 进程 


Zygote 
进程 
























































11.2 Zygote 和 应 用 程序 的 关系 


11.1.5 bionic 
bionic 是 Android 平台 的 libe， 也 就 是 C 库 。Linux 发 行 版 中 一 般 会 加 入 一 种 叫 作 glibe 
的 C 库 ,不 过 Android 却 有 它 独 自 的 C 库 bionic。glibe 用 于 柑 入 也 未 免 太 大 了 。 
话 虽 这 么 说 ，bionic 并 不 全 部 是 原创 的 ， 它 就 好 比 是 “把 BSD libe 改良 成 了 一 个 用 于 


Android 的 东西 ”。 





























11.1.6 ashmem 








ashmem 为 android 而 生 ， 是 一 个 共享 内 存 的 设备 。 它 是 作为 模块 做 入 Linux 内 核 的 。 有 
Android 手机 的 读者 可 以 试 着 1s“/dev”， 应 该 能 够 确认 存在 /dev/ashmem 这 个 设备 。 
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ashmem 是 Anonymous Shared Memory Subsystem( 匿 名 共享 内 存 子 系统 ) 的 简称 。 就 如 它 
的 名 字 一 样 ，ashmem 是 为 了 有 效 处 理 共享 内 存 而 生 的 系统 。 
通过 ashmem 分 配 内 存 空间 时 ， 需 要 开局 /dewashmem 设备 , 使 用 mmap。 一 旦 执行 
mmap， 计 算 机 就 会 经 由 ashmem 最 终 从 tmpfsW 取得 数据 。 



































内 存 


ashmem tmpfs | | 


mmap() 

















图 11.3 通过 ashmem 设备 来 分 配 内 存 





ashmem 男 一 个 特别 的 功能 就 是 缓存 功能 。 如 果 我 们 在 ashmem 分 配 的 内 存 空间 中 设置 
一 块 标明 了 “这 个 可 以 删 了 ”的 内 存 空 间 ， 它 就 会 擅自 把 这 块 空间 返回 给 0S。 

在 Android 中 , 开发 者 准备 了 一 个 类 来 当 作 ashmem 的 Java 级 别 的 API， 这 个 类 叫 作 
android.os.MemoryFile。 我 们 先 把 它 记 下 ， 说 不 定之 后 碰 上 什么 情况 就 能 派 上 用 场 呢 。 

一 般 情 况 下 ， 应 用 程序 (Java) 的 内 存 管理 是 由 GC 全 权 负 责 的 。 然 而 即使 对 象 被 回收 了 ， 
对 象 保留 的 内 存 空间 也 不 会 马上 返回 给 0S。 大 多 数 情况 下 这 些 内 存 空间 都 被 缓存 在 其 处 ， 
而 没有 返回 给 0S。 

不 过 使 用 ashmem 的 话 就 不 一 样 了 。 在 ashmem 中 ， 释 放 的 内 存 空间 会 被 直接 返回 给 
0S。 因 此 ， 使 用 ashmem 能 非常 轻松 高 效 地 进行 缓存 操作 。 

/kernel/mm/ashmem.c 里 有 源 代 码 ， 对 ashmem 的 实现 有 兴趣 的 读者 请 自行 查阅 (后 面 将 
告诉 大 家 如 何 获得 源 代码 )。 



































11.1.7 dimalloc 


接 下 来 谈 谈 Android 的 malloc 吧 (话题 渐渐 转向 GC 了 呢 )。 

bionic 中 包含 的 malloc 当然 不 是 glibc malloc。Doug Lea 开发 了 一 个 替代 glibc malloc 的 
分 配 硕 ， 世 人 称 为 dmalloc。 

不 过 话说 回来 ，glibe malloc 也 是 由 dlmalloc 衍生 而 来 的 。glibe 的 malloc 已 经 过 时 了 ， 
因此 Android 平台 上 选用 了 更 有 原创 性 的 dlmalloc。 


Q@ tmpfs: 可 以 在 Linux 机 器 内 存 中 生成 的 文件 系统 。 因 为 文件 是 在 内 存 中 生成 的 ， 所 以 只 要 机 咒 一 断 电 ， 文 件 就 
会 被 删除 。 
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那么 我 们 就 来 学 学 怎么 用 这 个 dimalloc 吧 。 笔 者 想 用 dlmalloc 生成 一 个 自用 的 malloc()。 


static mspace mymspace = create_mspace(0,0) ; 


#define mymalloc(bytes) mspace_malloc(mymspace, bytes) 


光 用 这 两 名 代码 就 能 定义 一 个 自制 的 内 存 分配 函 数 mymalloc()。 当 然 ,， 定义 时 需要 编译 
并 链接 dlmalloc.c。 

在 dimalloc 中 ,我们 首先 要 用 create_mspace() 函数 生成 一 个 用 于 malloc 的 内 存 空间 。 
返回 的 mspace 是 一 个 指针 ， 指 向 保留 这 个 空间 的 结构 体 。 事实 上 在 进行 分 配 的 时 候 ， 程 序 会 
将 之 前 生成 的 mspace 和 想 要 的 内 存 空 间 大 小 传递 给 mspace_malloc() 印 数 ， 执 行 调用 。 

想 详细 了 解 dlmalloc 的 读者 请 查阅 Doug Lea 的 网 站 。 


咱 邑 放 重新 学 习 mmap 


mmap 在 DalvikVM 中 非常 活跃 。 下 面 我 们 将 对 mmap 进行 简单 的 说 明 ， 很 熟悉 mmap 的 
读者 可 以 跳 过 这 一 节 。 


11.2.1 _ 什么 是 mmap 

首先 我 们 来 看 看 mmap (内 存 映 射 文件 ) 是 如 何 产 生 的 。 

0S 提供 的 文件 的 API 很 难 随机 访问 。 假 设 有 一 个 程序 ， 它 是 按照 “第 2 个 字 节 一 第 30 
个 字 节 一 第 12 个 字 节 一 第 7 个 字 节 ”的 顺序 来 读 取 的 。 在 这 种 情况 下 ， 就 会 重复 如 下 操作 。 











。 移 动 到 指定 字 节 
。 将 文件 内 容 读 取 到 内 存 ( 缓 存 ) 
。 从 内 存 读 取 





这 样 不 太 有 效率 ， 于 是 mmap 就 证 生 了 。 

mmap 是 一 个 将 文件 内 容 整体 映射 到 内 存 的 系统 调用 。 因 为 内 存 比 文件 更 擅长 随机 访问 ， 
所 以 这 样 一 来 就 能 非常 高 速 地 运行 之 前 那个 程序 了 。 对 之 前 的 程序 而 言 ， 如 果 使 用 mmap 的 话 ， 
只 要 执行 以 下 操作 就 够 了 。 

顺带 一 提 ，mmap 连 设备 文件 都 可 以 映射 到 内 存 空间 。 至 于 mmap 的 兼容 性 ， 因 为 函数 
是 用 POSTIX2 定义 的 ， 所 以 只 要 是 以 POSIX 为 标准 的 0S， 使 用 起 来 就 没有 问题 。 



































GD dlmalloc: http://g.oswego.edu/dl/html/malloc.html, 
@ POSIX: Portable Operating System Interface (可 移植 操作 系统 接口 )， 为 以 不 同方 式 实现 的 UNIX OS 定义 的 共同 
的 API 标 准 。 
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文件 系统 内 存 (mmap) 


seek(3) mn 


一 read(f, buf) 




















一 一 > 
seek(20) read(f, buf) 





很 难 随 机 访问 容易 随机 访问 


图 11.4 对比 文 件 和 内 存 的 随机 访问 


11.2.2 ”活用 分 配 


实际 上 ， 在 这 种 情况 下 诞生 的 mmap 基本 没有 用 在 文件 的 映射 方面 ， 而 是 用 于 分 配 的 情 
况 比较 多 。 

有 一 个 叫 作 /dev/zero 的 设备 文件 ,该 文件 非常 特殊 ,简单 来 说 就 是 “0” 无限 持 续 。 我 
们 打开 这 个 设备 文件 ， 并 执行 mmap， 就 能 确保 没有 实体 文件 的 内 存 空间 。 不 管 怎么 读 取 这 
个 设备 文件 ， 它 都 只 会 出 来 “0”， 即 使 对 其 执行 写 信 操作， 数据 也 不 会 留 在 文件 里 。 因 为 文 
件 本 身 就 没有 实体 ， 所 以 即使 我 们 用 mmap 对 映射 的 内 存 空间 执行 写 和 操作， 只 要 电脑 的 
电源 一 断 ， 这 些 数据 就 会 消失 得 无 影 无 踪 。 也 就 是 说 ， 如 果 我 们 将 /dev/zero 这 个 设备 文件 
mmap， 电 脑 就 只 会 确保 指定 大 小 (在 写 入 了 “0” 的 状态 下 ) 的 内 存 空间 。 





























fd = open("/dev/zero", 0_RDONLY); 
ret = mmap(NULL, (4 * 1024), PROT_WRITE, MAP_PRIVATE, fd, 0); 


此 外 ， 使 用 MAP_ANONYMOUS 也 同样 可 以 分 配 。 





ret = mmap(NULL, (4 * 1024), PROT_WRITE, (MAP_PRIVATE1MAP_ANONYMOUS) ，-1，0) ; 




















通常 在 分 配 的 时 候 我 们 会 使 用 一 个 叫 作 brk 的 系统 调用 ， 这 是 扩展 C 的 堆 的 系统 调用 。 
不 过 C 的 堆 大 小 的 上 限 是 由 进程 决定 的 ， 即 使 我 们 想 用 brk 扩展 堆 也 做 不 到 。 

不 过 ， 如 果 使 用 指定 了 /dev/zero 的 mmap， 就 能 从 适当 的 场所 随意 保留 内 存 空 间 了 。 也 
就 是 说 ， 这 样 一 来 就 可 以 获得 比 brk 限制 少 且 体积 大 的 内 存 空间 。 因 此 当 我 们 想 一 下 子 获 取 
一 大 块 内 存 空 间 时 ， 这 个 方法 就 很 方便 。 不 过 大 家 要 注意 一 点 ，mmap 只 能 以 页 面 单 位 (4K 
字 节 ) 来 分 配 。 

















11.2 重新 学 习 mmap 277 





其 实在 之 前 介绍 的 dumalloc 的 内 部 分 配 小 体积 的 内 存 空 间 时 采用 的 就 是 brk， 不 过 在 分 
配 大 体积 的 内 存 空间 时 ， 就 要 用 mmap 了 。 


11.2.3 ”请求 页 面 调 度 


我 们 用 mmap 把 文件 映射 到 内 存 。 不 过 这 并 不 意味 着 把 1G 学 方 的 文件 直接 分 配给 物理 
内 存 ， 这 么 办 的 话 ， 有 多 少 内 存 空间 都 不 够 。 

当 mmap 结束 时 ， 实 际 上 物理 内 存 并 没有 被 执行 任何 分 配 ， 只 是 作为 虚拟 内 存 被 映射 了 。 
那么 该 在 什么 时 候 分 配 物 理 内 存 呢 ? 

答案 是 在 访问 虚拟 内 存 的 时 候 执行 分 配 。 因 为 物理 内 存 没有 被 分 配 到 虚拟 内 存 ， 所 以 访 
问 的 时 候 会 发 生 页 面 错 误 。 我 们 捕获 页 面 错误 ， 实 际 进 行 物理 内 存 的 分 配 。 


























虚拟 内 存 


xX txt 



























































图 11.5 请 求 页 面 调度 
像 这 样 在 执行 访问 时 分 配 物理 内 存 的 方式 称 为 “请 求 页 面 调度 ”(demand paging)。 


11.2.4 ”共享 映射 与 私有 映射 


在 执行 mmap 时 ， 有 “共享 映射 ”和 “私有 映射 ”两 种 映射 方式 可 供 选 择 。 

当 指定 共享 映射 来 执行 mmap 时 ， 虽 然 每 个 进程 的 地 址 空间 不 同 ， 但 它们 引用 的 物理 内 
存 是 一 样 的 。 也 就 是 说 ， 如 果 对 这 部 分 内 存 执行 写 人 操作 ,那么 这 项 操作 也 会 反应 在 其 他 进 
程 上 。 像 这 样 共享 物理 内 存 的 映射 就 称 为 “共享 映射 ”。 
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11.6 ”共享 映射 


只 要 对 mmap API 指定 MAP_SHARED 标志 ， 就 会 执行 共享 映射 。 

另 一 方面 ， 当 指定 私有 映射 执行 mmap 时 ， 每 个 进程 都 会 被 映射 到 不 同 的 物理 内 存 。 
为 文件 被 映射 到 了 不 同 的 物理 内 存 ， 所 以 即使 对 文件 执行 写 和 操作， 该 操作 也 不 会 反应 在 其 
他 进程 上 。 























11.7 ”私有 了 映射 


只 要 对 mmap API 指定 MAP_PRIVATE 标志 ， 就 会 执行 私有 映射 。 


11.2.5 ” 写 时 复制 技术 

之 前 也 跟 大 家 讲 过 ， 在 私有 映射 中 每 个 进程 占用 的 是 不 同 的 内 存 。 

但 是 我 们 没 必要 把 这 些 进程 都 分 别 进行 复制 ， 而 是 只 要 复制 重 写 的 部 分 就 好 。 也 就 是 说 ， 
一 开始 是 设置 一 个 整体 共享 的 物理 内 存 ， 然 后 从 这 块 物理 内 存 中 进行 读 取 。 不 过 在 进行 重 写 











11.3 DalvikVM 的 源 代码 




















时 ， 只 需要 复制 用 于 这 个 进程 的 重 写 的 部 分 即 可 。 因 为 是 在 重 写 的 时 候 进 行 复制 ， 所 以 称 为 
“ 写 时 复制 技术 ”(Copy-On-Write )。 这 是 请 求 页 面 调度 的 技术 之 一 。 
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图 11.8 写 时 复制 技术 


在 第 2 章 中 我 们 也 讲 到 过 这 项 功能 。 


荆 攻 甬 DalvikVM 的 源 代码 


那么 赶紧 来 获取 DalvikVM 的 源 代码 吧 。 这 次 我 们 用 于 解说 的 Android 版 本 是 1.572 
(DalvikVM 的 版 本 与 Android 平台 的 版 本 相同 )。 


11.3.1 ”获取 源 代码 
首先 为 大 家 介绍 一 个 面向 Android 开发 者 的 网 站 (图 11.9)。 


http://developer.android.com/index.html 

这 个 网 站 会 向 Android 开发 者 发 送 各 种 各 样 的 信息 。 大 家 可 以 在 上 面 注册 自己 开发 的 应 用 ， 
以 及 观看 关于 Android 的 视频 教程 。 

此 外 大 家 还 可 以 从 这 个 网 站 获取 Android SDK。 

http://developer.android.com/sdk/1.5_r2/index.html (本 书 执 笔 时 的 最 新 版 本 ) 

Android SDK 是 基于 Android 平 台 的 应 用 开发 工具 ， 其 中 包含 Android 终端 的 模拟 器 和 
DalvikVM 的 执行 文件 等 。 

不 过 我 们 这 次 想 要 的 是 DalvikVM 的 源 代 码 。 科 好 Android 是 一 个 开源 项 目 ， 所 以 我 们 
能 轻松 从 下 面 这 个 网 站 获取 源 代码 。 
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图 11.9 屏幕 截图 


http://source.android.com/ 

有 两 种 方法 可 以 获取 DalvikVM 的 源 代码 。 

第 一 种 方法 是 使 用 Android 平台 上 一 个 叫 作 repo 的 独立 工具 来 整个 获取 源 代码 。 关 于 这 
个 工具 ， 下 面 的 网 页 中 为 大 家 介绍 了 详细 的 下 载 方法 。 

http://source.android.com/release-features 

使 用 这 个 方法 能 够 整个 获取 Android 源 代码 群 ， 所 以 相当 花 时 间 (笔者 花 了 约 20 分 钟 )。 

此 外 ， 因 为 我 们 用 repo 获取 的 源 代 码 是 现在 的 开发 版 本 ， 所 以 还 必须 用 下 述 指令 切换 
到 本 次 解说 所 使 用 的 版 本 (1.5r2) 的 分 支 。 


repo forall git co android-1.5r2 -b read-android-1.5r2 


第 二 个 方法 是 用 git 只 获取 DalvikVM。 
Android 的 源 代码 内 部 是 由 众多 git 仓库 汇聚 而 成 的 。 
https://github.com/android 
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为 这 其 中 有 用 于 DalvikVM 的 git 仓库 ， 所 以 我 们 将 其 git clone。 
git clone git://github.com/android/platform_dalvik.git 
在 这 种 情况 下 ， 我 们 也 把 分 支 切 换 到 这 次 解说 所 用 的 版 本 吧 。 
git co android-1.5r2 -b read-android-1.5r2 


对 于 想 实 际 运作 DalvikVM 的 读者 ， 笔 者 建议 使 用 第 一 个 方法 。 虽 然 要 获取 整个 Android 
很 费时 间 ， 不 过 第 一 个 方法 也 有 它 的 优点 一 一 只 需 按 照 所 提示 的 步骤 进行 操作 ， 就 能 很 轻 
松 地 搭建 好 运行 环境 。 

对 于 真心 想 了 解 DalvikVM 源 代码 的 读者 ， 笔 者 建议 使 用 第 二 个 方法 。 因 为 在 这 种 情况 
下 我 们 没有 必要 去 实际 运作 DalvikyVM， 只 要 获取 它 的 git 仓库 就 可 以 了 。 


11.3.2 ” 源 代码 结构 


用 repo 获取 了 源 代码 的 读者 可 以 发 现 ， 其 中 有 一 个 叫 作 dalvik 的 目录 ，DalvikVM 相关 
的 源 代码 就 配置 在 里 面 。 
那么 我 们 先 来 简单 地 说 明 一 下 主要 的 目录 吧 。 


表 11.1 dalvik 内 目录 的 结构 


docs 文档 
libcore Java 类 库 群 ， 使 用 ApacheHarmony 中 
tests 测试 
vm DalvikVM 的 源 代码 























因为 本 书 的 内 容 没 有 涉及 VM 以 外 的 部 分 ， 所 以 这 里 就 不 详细 说 明 这 些 目录 了 。 
在 这 里 重要 的 是 vm 这 个 目录 ， 其 中 配置 着 DalvikVM 的 源 代 码 。 目 录 结 构 如 表 11.2 所 示 。 





表 11.2 vm 内 的 目录 结构 





分 配 、 释 放 之 类 的 操作 (其 中 也 包括 GC ) 
定义 对 象 
DalvikVM 求 值 器 

















GD Apache Harmony: Java SE 的 开源 版 开发 项 目 ， 开 发 内 容 为 VM 和 类 库 等 。 
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此 外 ，vm 目录 内 的 源 代码 分 布 如 表 11.3 所 示 。 


表 11.3 源 代码 分 布 
源 代码 行 数 


60 325 
22 071 








DalvikVM 由 约 8 万 行 的 源 代码 构成 。 其 中 大 部 分 都 是 用 C 语言 描述 的 ,但 VM 的 核心 
部 分 (运算 部 分 等 ) 则 是 由 汇编 语言 描述 的 。 


入 人 DalvikVM 的 GC 算法 


接 下 来 终于 该 说 到 GC 了 。 

DalvikVM 的 垃圾 回收 采用 的 是 GC 标记 - 清除 算法 。GC 标记 - 清除 算法 会 标记 所 有 活 
动 对 象 ， 清 除 所 有 非 活动 对 象 ， 大 家 还 记得 吧 。 

此 外 ，DalvikVM 采用 位 图 标记 手法 ， 这 个 方法 是 将 标志 位 抽出 到 其 他 的 小 空间 ， 作 为 
位 图 来 管理 。 

关于 这 些 算法 的 详细 内 容 我 们 已 经 在 第 2 章 中 说 明 过 了 ， 请 大 家 查阅 之 前 的 部 分 。 

此 外 ， 因 为 DalvikVM 只 能 在 Android 平台 上 运作 ， 所 以 跟 其 他 语言 处 理 程 序 搭载 的 GC 
性 质 略 有 不 同 。 请 大 家 留意 这 点 ， 继 续 往 下 阅读 。 


11.5 


在 了 解 GC 之 前 ， 我 们 移 从 数据 结构 开始 看 吧 。 这 样 理解 起 来 应 该 比较 快 。 


11.5.1 “对 象 的 种 类 
DalvikVM 有 4 种 对 应 对 象 的 结构 体 ， 下 面 就 为 大 家 一 一 介绍 。 








表 11.4 _ Java 的 数据 和 内 部 定义 的 结构 体 的 对 应 关系 
结构 体 名 对 应 的 Java 的 数据 
ClassObject > 
DataObject 
ArrayObject 











StringObject 








11.5 ”对象 管理 






































首先 是 结构 体 class0bject。 这 个 对 象 表示 Java 的 类 。 不 管 是 用 户 定 义 的 类 还 是 使 用 库 
定义 的 类 ， 从 内 部 来 说 这 个 classobject 都 会 被 保留 到 内 存 空间 。 





// 定义 类 

// 内 部 定义 Class0bject 
public class Clazz { 

站 





下 面 是 结构 体 Data0bject。 它 对 应 之 前 介绍 的 类 的 实例 。 


// 定义 类 
class Clazz +{ 


} 


public class MakeData0bject { 
static public void main(String args[]) { 
// 生成 实例 
// 内 部 定义 Data0bject 


Clazz data0bject = new Clazz(); 




















接 下 来 是 结构 体 Array0bjecto 就 如 它 的 名 字 一 样 ， 对 应 的 是 数组 。 
最 后 是 结构 体 String0bjecto 也 跟 它 的 名 字 一 样 ， 对 应 的 是 字符 串 。 


11.5.2 _ 对 象 结构 
下 面 让 我 们 一 起 来 看 看 结构 体 Data0bject 和 Array0bject 吧 。 



































dalvik/vm/oo/Object.h 
203 | struct Data0bject { 
204 Object obj; /* 必须 配置 在 开头 */ 
205 
206 
207 u4 instanceData[1] ; 
208 | }; 


236 | struct ArrayObject { 


237 0bject obj; /* 必须 配置 在 开头 */ 
238 

239 /* 元 素数 量 。 数 组 初始 化 后 不 变 */ 

240 u4 length; 





241 


283 


284 第 11 章 DalvikVM 的 垃圾 回收 


/* 数组 元 素 */ 
247 u8 contents [1] ; 
248 | }; 























第 207 行 的 u4 是 uint32_t i 意思 就 是 4 字 节 (32 位 ) 的 非 负 整数 。 同 理 ， 第 247 
行 的 u8 是 uint64._t 的 别名 ， 意思 是 8 字 节 (64 位 ) 的 非 负 整数 。 
想必 各 位 会 在 意 每 个 对 象 结构 体 开头 的 0bject 结构 体 吧 。 


dalvik/vm/oo/Object.h 


170 | typedef struct Object { 


171 /* 指向 类 对 象 的 指针 */ 


















































二 7 之 Class0bject* clazz: 
173 

174 /* 用 于 锁定 synchronized */ 
i175 Lock lock; 





176 | } Object; 

















第 172 行 的 成 员 clazz 持 有 结构 体 class0bject (与 类 对 应 ) 的 指针 。 也 就 是 说 ， 这些 对 
象 的 结构 如 下 所 示 。 


Object DataObject StringObject ArrayObject 






ClassObject* clazz; 


Object obj Object obj; Object obj; 


Lock lock; 





u4 instanceData[1] 


u4 instanceData[1]; u4 length; 


ug8 contents[1]; 





图 11.10 对象 的 结构 


结构 体 classobject 里 记录 着 各 个 实例 的 加 载 信息 。 这 部 分 跟 GC 没有 太 大 关系 ， 就 不 
详细 说 明了 。 


11.5.3 ”DalvikVM 的 内 存 结构 


DalvikVM 专用 的 堆 中 保留 着 DalvikVM 的 堆 ， 此 外 还 存在 一 个 叫 作 HeapSource 的 保留 
堆 的 东西 。 本 章 中 我 们 将 二 者 分 别称 为 VM Heap 和 VM HeapSource。 

VM HeapSource 基本 上 保留 着 两 种 VM Heap。 

第 一 种 是 用 于 Sy 有 Android 应 用 程序 的 父 进 程 ) 的 VM Heap。 i 会 
Android 启动 时 开始 运行 ,执行 一 些 预 处 理 操作 ,例如 动态 读 取 要 被 连接 的 库 群 等 。 
VM Heap 就 是 在 这 2 用 的 。 
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第 二 种 是 分 别 在 每 个 Android 应 用 程序 中 使 用 的 VM Heap。 当 Android 应 用 程序 (例如 
电话 本 等 ) 需 要 内 存 的 时 候 ， 程 序 就 从 这 个 VM Heap 进行 分 配 。 
那么 先 从 VM Heap 开始 看 吧 。 





dalvik/vm/alloc/HeapSource.c 


100 





typedef struct { 


mspace 


*msp; 


HeapBitmap objectBitmap; 


size_t 
size_t 
size_t 


} Heap; 


absoluteMaxSize; 
bytesAllocated; 
objectsAllocated; 


结构 体 Heap 的 成 员 msp (memory space 的 简称 ) 持 有 指向 malloc 完毕 的 内 存 空 间 的 指针 ， 其 


中 分 配 的 都 是 实际 的 对 象 。 objectBitmap 中 保留 着 与 对 象 对 应 的 位 图 空间 。absoluteMaxSize 是 











可 分 配 到 msp 的 内 存 上 限 ， bytesAllocated 是 已 经 分 配 的 内 存量 ( 字 节 )， objectsAllocated 





是 分 配 完成 的 对 象 数量 。 


下 面 来 看 一 下 VM HeapSource。 


dalvik/vm/alloc/HeapSource.c 


124 





struct HeapSource { 


size_t 
size_t 
size_t 
size_t 
size_t 


size_t 


targetUtilization; 
minimumSize; 
startSize; 
absoluteMaxSize; 
idealSize; 


softLimit; 


Heap heaps [HEAP_SOURCE_MAX_HEAP_COUNT] ; 


size_t 
size_t 


size_t 


numHeaps; 
externalBytesAllocated; 


externalLimit; 


bool sawZygote; 


后 








其 中 有 两 个 成 员 硕 望 大 家 注意 ， 那 就 是 heaps 和 numHeapso 数组 heaps 的 元 素数 量 是 用 
宏 HEAP_SOURCE_MAX_HEAP_COUNT 固定 的 。 


dalvik/vm/alloc/HeapSource.h 


28 | #define HEAP_SOURCE_MAX_HEAP_COUNT 3 


的 数 





这 样 一 来 heaps 的 元 素数 量 的 上 限 就 是 3 个 。 numHeaps 里 面 是 
量 


» 
o 




















分 配给 heaps 的 VM Heap 
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HeapSource 
用 于 应 用 程序 的 堆 
用 于 Zygote 的 堆 


Heap 


图 11.11 VM HeapSource 的 结构 








以 图 11.11 为 例 ，numHeaps 就 是 2。 一旦 Source 被 读 取 了 ，heaps 的 第 3 个 元 素 也 就 不 
能 被 使 用 了 。 


11.5.4 _ dvmHeapSourceStartup0 
VM HeapSource 是 用 dvmHeapSourceStartup() 函数 生成 的 。 这 个 函数 比较 长 ， 所 以 我 们 
分 成 前 半 部 分 和 后 半 部 分 为 大 家 说 明 。 此 外 ， 这 里 还 删除 了 错误 处 理 和 注释 。 





dalvik/vrn/alloc/HeapSource.c: dvmHeapSourceStartup(): 前 半 部 分 





392 | GcHeap +* 

393 | dvmHeapSourceStartup(size_t startSize, size_t absoluteMaxSize) 
394 | 荆 

395 GcHeap *gcHeap; 

396 HeapSource *hs; 

397 Heap *heap; 

398 mspace msp; 

399 

411 msp = createMspace(startSize, absoluteMaxSize, 0); 
418 gcHeap = mspace_malloc(msp, sizeof (*gcHeap)); 

423 memset (gcHeap, 0, sizeof (*gcHeap)); 

424 

425 hs = mspace_malloc(msp, sizeof(*hs)); 

430 memset(hs, 0, sizeof (*hs)); 





一 般 规定 在 公开 的 函数 的 名 称 开头 要 加 上 avm(dalvik vm 的 简称 )。 也 就 是 说 ， 这 个 函数 
已 经 被 公开 了 。 


首先 把 startSize 和 absoluteMaxSize 作为 参数 传递 给 


把 初始 VM Heap 大 小 传递 
的 情况 下 ， 初始 VM Heap 的 大 小 就 是 这 
默认 为 2M 字 节 。 























absoluteMaxSize 是 能 将 内 存 分 配给 VM Heap 的 “最 大 VM Heap 大 小 ” 
间 。 在 


Heap 分 配 超过 这 个 大 小 的 内 存 空 
的 情况 下 ， 最 大 VM Heap 大 小 就 是 这 
aa 




















么 我 们 来 讲 一 下 函数 的 内 容 吧 。 


给 startSizeo 在 


这 个 值 。 如 果 没 有 指定 ， 


个 值 。 如 果 没 有 被 指定 ， 
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dvmHeapSourceStartup() 国 数 ， 
间 定 了 Java 的 启动 选项 -xms (初始 VM Heap 大 小 ) 
那么 初始 VM Heap 的 大 小 就 


。 我 们 不 能 给 V 
先 项 -xmx (最 大 VM Heap je 
那么 初始 VM Heap 的 大 小 就 


虽 定 了 Java 的 启动 选 





第 411 行 的 createMspace() 图 数 是 dlmalloe 的 





create_mspace() 函数 的 外 包 函 数 ， 其 处 理 内 容 跟 create_mspace() 函数 相同 ， 都 是 生成 用 


于 malloc 的 内 存 空 


间 (DalvikVM 的 堆 )。 因 为 按理 说 dlmalloc 中 会 事先 准备 出 内 存 空 


间 ， 所 


以 这 里 就 提前 生成 内 存 空间 了 。 我 们 把 初始 VM Heap 大 小 和 最 大 VM Heap 大 小 作为 参数 ， 
它们 分 别 对 应 了 malloe 的 内 存 空 间 的 初始 大 小 和 最 大 大 小 。 因 为 这 个 函数 的 内 容 没 什么 意思 ， 
我 们 就 不 再 详 述 了 。 

startSize absoluteMaxSize 


msp 初始 VM Heap 空间 可 扩展 空间 
(已 分 配 了 内 存 ) (未 分 配 内 存 ) 


图 11.12 用 createMspace() 生成 的 内 存 空 


第 418 行 代码 负责 保留 结构 体 gcHeap， 第 425 行 负责 


们 已 经 提 到 ， 
Zygote 的 VM Heap。 

















dalvik/vm/alloc/HeapSource.c: dvmHeapSourceStartup(): 


间 的 结构 


责 保留 吉 构 体 HeapSource。 前 面 我 





DalvikVM 有 用 于 Zygote 和 用 于 应 用 程序 的 两 种 VM Heap， 这 里 生成 的 是 用 于 
也 就 是 说 ，gcHeap 和 hs 被 分 配 到 了 用 于 Zygote 的 VM Heap。 


后 半 部 分 


// no soft limit at first 


absoluteMaxSize); 


gcHeap, false); 


433 hs->minimumSize = 0; 

434 hs->startSize = startSize; 

435 hs->absoluteMaxSize = absoluteMaxSize; 
436 hs->idealSize = startSize; 

437 hs->softLimit = INT_MAX; 

438 hs->numHeaps = 0; 

439 hs->sawZygote = gDvm.zZygote; 

440 addNewHeap (hs, msp, 

444 

445 gcHeap->heapSource = hs; 

446 

447 countAllocation(hs2heap (hs) ， 

448 countAllocation(hs2heap(hs), hs, 





false); 
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449 

450 gHs = hs; 

451 return gcHeap; 
456 | } 





第 433 行 到 第 440 行 的 代码 所 进行 的 操作 是 初始 化 HeapSource。 

这 里 有 一 点 希望 大 家 注意 ， 那 就 是 在 第 437 行进 行 的 softLimit 的 初始 化 。softLimit 是 由 
DalvikVM 决定 的 ， 它 是 能 分 配 到 VM Heap 空间 的 软件 上 的 界限 。 已 知 这 里 已 经 设 定 了 INT_ 
MAX， 这 个 宏 里 定义 了 int 的 最 大 值 (2 147 483 647 ) 

此 外 ,在 第 439 行 第 一 次 出 现 了 全 局 变量 gpvm。 这 个 全 局 变量 持 有 与 DalvikVM 相关 的 
各 种 设 定 值 。Dvm 有 DalvikVM 的 意思 。 

剩 下 的 部 分 我 们 随便 看 看 就 好 。 

在 第 440 行 调 用 aadaNewHeap() 函数 ， 生 成 VM Heap。 下 一 节 中 我 们 会 详细 说 明 这 个 函数 。 

在 第 447 行 和 第 448 行 调用 countAllocation() 函数 。 这 只 是 把 之 前 分 配 的 gcHeap 等 的 
大 小 加 到 bytesAllocated (VM Heap 使 用 的 字 节 数 ) 里 而 已 。11.5.9 节 中 会 介绍 到 这 个 函数 。 

在 第 450 行 给 全 局 变量 gHs 设 定 这 次 生成 的 VM HeapSource 的 指针 。 大 家 应 该 已 经 注意 
到 了 吧 ，DalvikVM 的 源 代码 要 求 带 有 全 局 变量 名 称 的 首 字 母 g， 即 global 的 g。 

另外 ， 顾 名 思 义 ，dvmstartup() 也 数 是 在 DalvikVM 启动 时 调用 的 。 孔 数 调 用 关系 图 如 
下 所 示 。 
































dvmStartup() 一 一 DalvikVM 的 启动 也 数 
dvmGcStartup() 一 一 初始 化 Gc 
dvmHeapStartup() 


dvmHeapSourceStartup() 


11.5.5 _ addNewHeap( 
那么 实际 来 看 看 生成 YM Heap 的 函数 吧 。 这 个 函数 也 分 成 前 半 部 分 和 后 半 部 分 讲解 。 


dalvik/vm/alloc/HeapSource.c: addNewHeap(): 前 半 部 分 





321 | static bool 

322 | addNewHeap (HeapSource *hs, mspace *msp, size_t mspAbsoluteMaxSize) 
323 | 荆 

324 Heap heap; 

333 memset (&heap, 0, sizeof (heap)); 

334 

335 if (msp != NULL) { 

336 heap.msp = msp; 

337 heap.absoluteMaxSize = mspAbsoluteMaxSize; 


11.5 ”对象 管理 








338 } else { 

339 Size_t overhead; 

340 

341 overhead = oldHeap0Overhead(hs, true); 

348 heap.absoluteMaxSize = hs->absoluteMaxSize - overhead; 

349 heap.msp = createMspace (HEAP_MIN_FREE, heap.absoluteMaxSize, 
350 hs->numHeaps); 

354 二 


addNewHeap() 困 数 把 VM HeapSource 的 hs、VM Heap 的 实体 msp 以 及 VM Heap 空间 的 
最 大 大 小 mspAbsoluteMaxSize 作为 参数 接收 。 

第 335 行 代 码 的 处 理 内 容 是 检查 参数 msp 是 否 为 NULL。 如 果 不 为 NULL， 就 把 msp 和 
mspAbsoluteMaxSize 设 定 为 结构 体 Heapo 

当 msp 为 NULL 时 ， 生 成 新 的 VM Heap。 第 341 行 的 oldHeap0verhead() 函数 对 现在 VM 
HeapSource 中 的 VM Heap 返回 实际 被 分 配 的 内 存 空 间 大 小 。 也 就 是 说 ， 在 第 348 行进 行 的 
计算 是 “VM Heap 的 最 大 大 小 减 去 VM Heap 的 使 用 大 小 ”。 

然后 基于 这 个 结果 在 第 349 行 生 成 新 的 VM Heap。 传 递 给 参数 的 HEAP_MIN_FREE 是 VM 
Heap 的 初始 大 小 ， 默 认为 S12K 字 节 。 












































dalvik/vm/alloc/HeapSource.c 


45 #define HEAP_IDEAL_FREE (2 * 1024 * 1024) 
46 #define HEAP_MIN_FREE (HEAP_IDEAL_FREE / 4) 





接 下 来 需要 大 家 注意 的 一 点 就 是 参数 msp 可 能 为 NULL。 如 11.5.4 节 中 所 述 , 在 
dvmHeapSourceStartup() 图 数 中 生成 并 分 配 VM Heap。 也 就 是 说 ， 有 其 他 地 方 调用 的 参数 msp 
值 可 能 为 NULL。 

这 其 实 是 在 启动 Android 应 用 程序 之 前 调用 的 。 请 大 家 回忆 一 下 ， 之 前 我 们 在 11.5.3 节 讲 过 ， 
VM Heap 分 为 两 种 ,一 种 用 于 Zygote， 男 一 种 用 于 应 用 程序 。 用 dvmHeapSourceStartup() 疗 
数 生 成 的 VM Heap 是 用 于 Zygote 的 。 当 启动 应 用 程序 时 ， 因 为 需要 应 用 程序 专用 的 新 VM 
Heap， 所 以 要 把 NULL 传递 给 aaqNewHeap() 函数 的 msp， 在 函数 内 部 分 配 VM Heap。 























dalvik/vm/alloc/HeapSource.c: addNewHeap(): 后 半 部 分 


355 dvmHeapBitmapInit(&heap.objectBitmap, 

356 (void *)ALIGN_DOWN_TO_PAGE_SIZE (heap.msp), 
357 heap.absoluteMaxSize, 

358 "objects") 

366 if (hs->numHeaps > 0) { 

367 mspace *msp = hs->heaps[0] .msp; 
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368 mspace_set_max_allowed_footprint (msp, mspace_footprint (msp) ) ; 
369 了 
374 memmove (&hs->heaps[1] ，&hs->heaps[0] ， 
hs->numHeaps * sizeof(hs->heaps[0])); 
375 hs->heaps[0] = heap; 
376 hs->numHeaps++; 
377 
378 return true; 
385 | } 





在 第 355 行 生成 位 图 。 关 于 这 部 分 我 们 会 在 下 一 节 详 细 说 明 。 

第 367 行 到 第 368 行进 行 的 处 理 则 是 给 heaps [o] .msp( 现 在 正在 使 用 的 VM Heap) 加 上 
一 个 限制 条 件 ， 使 其 不 能 进行 新 的 分 配 。 

第 368 行 的 mspace_footprint() 图 数 是 用 dlmalloc 定义 的 。 把 dlmalloc 生成 的 mspace 
的 指针 传递 给 这 个 函数 ， 就 会 返回 mspace 实际 使 用 的 (正在 分 配 的 ) 字 节 数 。 顺 带 一 担 ， 郴 
数 名 中 的 footprint 的 意思 是 “使 用 的 内 存量 ”。 

mspace_set_max_allowed_footprint() 函数 是 对 内 存 空 间 设 置 制约 条 件 的 函数 ， 它 规定 
了 “只 能 分 配 到 这 个 字 节 数 为 止 "*， 这 个 函数 也 是 用 dlmalloc 定义 的 。 在 这 种 情况 下 ， 因 为 
内 存 空间 现在 的 字 节 数 被 传递 给 了 参数 ， 所 以 不 能 对 这 个 内 存 空 间 执行 新 的 分 配 操作 。 当 然 ， 
这 个 内 存 空间 内 如 果 有 空间 得 到 释放 ， 就 可 以 按 释放 的 空间 大 小 执行 分 配 操 作 。 

之 后 在 第 374 行 到 第 376 行将 新 的 VM Heap 插入 到 VM HeapSource 的 开头 。 























HeapSource HeapSource 
用 于 Zygote 的 堆 用 于 应 用 程序 的 堆 
Heap[*| 使 用 空间 未 使 用 空间 使 用 空间 | 未 使 用 空间 | 可 分 配 




















用 于 Zygote 的 堆 


使 用 空间 “| 只 读 








HI 














Heap 


Heap 








图 11.13 追加 VM Heap 


事实 上 在 DalvikVM 中 从 VM Heap 分 配 内 存 的 时 候 ， 肯定 要 从 VM HeapSource 开头 的 
VM Heap 开始 分 配 。 除 了 VM HeapSource 开头 的 VM Heap 之 外 ， 其 他 的 VM Heap 都 是 只 读 
的 ， 即 使 有 空间 被 释放 也 不 能 新 分 配 什 么 。 因 此 ， 之 前 一 直 使 用 的 VM Heap 有 一 个 限制 条 件 ， 
即 不 能 执行 新 的 分 配 操 作 。 























11.5 ”对象 管理 





11.5.6 ”对 象 位 图 





因为 DalvikVM 的 垃圾 回收 算法 采用 的 是 “位 图 标记 ”， 所 以 存在 标记 用 的 “位 图 ”。 
DalvikVM 中 有 两 种 位 图 。 

1. 标记 位 图 

2. 对 象 位 图 








标记 位 图 是 在 GC 标记 时 使 用 的 位 图 。 

对 象 位 图 则 用 于 获取 分 配 到 VM Heap 内 的 对 象 的 位 置 。 每 次 往 VM Heap 内 分 配对 象 时 ， 
都 会 执行 位 图 标记 操作 。 

对 象 位 图 存在 于 每 个 VM Heap 内 。 





dalvik/vm/alloc/HeapSource.c: 再 看 一 遍 


100 
103 
107 
4411 
7 
121 
122 





typedef struct { 
mspace *msp; 
HeapBitmap objectBitmap; 
size_t absoluteMaxSize; 
size_t bytesAllocated; 
size_t objectsAllocated; 


} Heap; 


看 过 结构 体 VM Heap 后 ， 再 来 看 第 107 行 分 配 结构 体 HeapBitmap 的 操作 。 HeapBitmap 这 个 
结构 体 是 怎么 样 的 呢 ? 





dalvik/vm/alloc/HeapBitmap.h: 翻译 注释 


51 
54 
55 
56 
58 
59 
60 
61 
64 
65 
66 
70 
71 





typedef struct { 
/* 位 图 */ 


unsigned long int *bits; 





/* 位 图 的 字 节 数 */ 


size_t bitsLen; 


/* 对 应 位 图 的 VM Heap 空 间 的 开头 */ 


uintptr_t base; 




















/* 内 存 空间 内 正在 使 用 的 空间 的 尾 指针 */ 


uintptr_t max; 





} HeapBitmap; 








位 图 不 是 什么 特别 的 东西 ， 只 是 unsigned long int 的 数组 。 我 们 用 第 55 行 的 成 员 
bits 保留 位 图 。 因 为 是 unsigned long int 的 数组 ， 所 以 1 个 元 素 的 大 小 最 低 也 要 有 4 个 字 
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节 。 因 此 位 图 1 列 有 32 个 位 。 

有 一 点 大 家 必须 注意 ， 因 为 位 图 是 用 mmap() 函数 分 配 的 ， 所 以 要 用 4K 字 节 的 倍数 大 小 
来 分 配 位 图 。 

此 外 ,第 64 行 的 base 里 放 着 VM Heap 的 开头 地 址 。 这 个 地 址 实际 上 并 不 是 指向 内 存 
空间 开头 的 ， 里面 存 着 以 4K 字 节 对 齐 的 地 址 。 











对 象 位 图 
bitsLen 


bits | 10.00 | 00.00 | ，…， Ds 








让 


base max 


DalvikVM Heap 








图 11.14 位 图 的 结构 


11.5.7 _ dvmHeapBitmaplnit() 
对 象 位 图 是 由 avmHeapBitmaplnit() 函数 创建 的 。 因 为 函数 名 中 带 有 dvm 三 个 字母 ， 所 
以 可 想 而 知 dvmHeapBitmaplnit() 是 已 经 公开 的 函数 。 
在 追加 VM Heap 时 需要 调用 这 个 函数 ， 这 一 点 已 经 在 之 前 的 11.5.5 节 中 说 明 过 了 ， 下 
面 让 我 们 再 回头 看 一 眼 。 











dalvik/vm/alloc/HeapSource.c: addNewHeap(): 提要 
321 | static bool 


322 | addNewHeap (HeapSource *hs, mspace *msp, size_t mspAbsoluteMaxSize) 


323 | 荆 

355 dvmHeapBitmapInit (&heap.objectBitmap, 

356 (void *)ALIGN_DOWN_TO_PAGE_SIZE(heap .msp) ， 
357 heap.absoluteMaxSize, 

358 "objects") 





385 | } 





这 里 让 人 在 意 的 是 第 356 行 的 宏 ALIGN_DOWN_T0_PAGE_SIZE()。 这 
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个 宏 把 获取 的 地 址 以 


4K 字 节 去 尾 对 齐 ， 也 就 是 说 ， enet “3K 字 节 ”传递 给 这 个 宏 ， 就 会 返回 “0 ”。 


基于 上 述 内 容 ， 下 列 参 数 会 被 传递 给 uvmHeapBitmaplnit() 函数 。 


。 未 初始 化 的 HeapBitmap 

。 将 VM Heap 的 开头 地 址 (heap.msp ) 以 4 区 字 节 对 齐 的 值 
。 最 大 VM Heap 大 小 (heap.absoluteMaxSize ) 

。 "object" (字符 串 ) 


我 们 把 以 上 内 容 放 在 心里 ， 一 起 来 看 看 avmHeapBitmaplnit() 函数 吧 。 


dalvik/vmy/alloc/HeapBitmap.c: 省 略 错误 处 理 


40 | bool 

41 | dvmHeapBitmapInit(HeapBitmap *hb, const void *base, size_t maxSize, 
42 const char *name) 

43 | 

44 void *bits; 

45 size_t bitsLen; 

46 size_t allocLen; 

47 int. Eds 

48 char nameBuf [ASHMEM_NAME_LEN] = HB_ASHMEM_NAME; 

49 

52 bitsLen = HB_OFFSET_TO_INDEX(maxSize) * sizeof (*hb->bits); 

53 allocLen = ALIGN_UP_TO_PAGE_SIZE(bitsLen); // required by ashmem 
54 

58 fd = ashmem_create_region(nameBuf, allocLen); 

66 bits = mmap(NULL, bitsLen, PROT_READ | PROT_WRITE, MAP_PRIVATE, fd, 0); 
67 close(fd) ; 

73 

74 memset (hb, 0, sizeof (*hb)); 

75 hb->bits = bits; 

76 hb->bitsLen = bitsLen; 

村 村 hb->base = (uintptr_t)base; 

78 hb->max = hb->base - 1; 

79 

80 return true; 

81|} 





在 第 52 行 , 根据 maxsize( 最 大 VM Heap 大小) 计算 bitsLen( 位 图 大 小 )。 宏 HB 


OFFSET_T0_INDEX() 会 由 VM Heap 的 开头 地 址 到 作为 对 象 的 object 的 偏 移 来 计算 位 图 索引 。 
也 就 是 说 ， 只 要 在 这 里 计算 位 图 的 “最 大 索引 x 元 素 的 大 小 ”， 就 算出 了 位 图 整体 的 大 小 。 
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bitsLen 


sizeof(*hb->bits) | 
数组 一 个 元 素 的 大 小 





HB_OFFSET_TO_INDEX(maxSize) 
位 图 表格 最 后 的 索引 





DalvikVM Heap 


11.15 ”计算 位 图 大 小 


在 第 53 行 ,用 4K 字 节 将 计算 出 来 的 bitsLen 进 一 对 齐 。 

ashmem_create_region() 函数 是 用 Android 的 ashmem 定义 的 函数 。 关 于 ashmem 我 们 
在 11.1.6 节 中 已 经 讲 过 了 。 在 ashmem_create_region() 函数 中 将 获取 指向 /dev/ashmem 的 文 
件 描述 符 、 进 行 初始 设 定 等 。 

在 第 66 行 用 mmap() 函数 分 配 位 图 , 在 内 存 保护 里 加 入 PROT_READ( 可 读 取 ) 和 PROT_ 
WRITE( 可 写 和 人 )。 把 ashmem_create_region() 函数 的 结果 加 入 参数 的 文件 描述 符 ， 即 通过 
ashmem 来 分 配 内 存 空 间 。 我 们 将 已 映射 的 内 存 空 间 设 为 MAP_PRIVATE( 私 人 的 )。 也 就 是 说 ， 
即使 在 内 存 空间 执行 写 人 操作 ， 也 不 会 反映 到 其 他 进程 上 。 

第 75 行 到 第 78 行 的 操作 用 于 初始 化 结构 体 HeapBitmap。 在 此 请 大 家 注意 第 78 行 ， 这 
里 将 base( 与 位 图 对 应 的 空间 ) 减 去 1 的 值 放 在 了 max 里面。 事实 上 如 果 max 是 一 个 低 于 
base 的 值 ， 就 意味 着 “还 没有 在 位 图 表格 中 设置 任何 位 ”。 因 此 也 将 其 作为 标志 使 用 。 


























11.5.8 _ 分 配 到 DalvikVM 的 VM Heap 空间 
下 面 来 看 看 把 对 象 分 配 到 DalvikVM 的 VM Heap 空间 的 人 处理。 
把 对 象 分 配 到 VM Heap 空间 的 函数 的 形成 过 程 如 以 下 调用 图 所 示 。 
dvmMalloc() 


tryMalloc() 


dvmHeapSourceAlloc() 








首先 来 看 看 drmMalloc() 函数 。 它 有 180 行 ， 是 个 非常 大 的 函数 ， 不 过 其 中 一 大 半 都 是 用 于 
错误 处 理 或 配置 文件 的 。 省 略 掉 这 些 细 校 术 节 的 内 容 后 ， 代 码 如 下 所 示 。 


11.5 ”对象 管理 


dalvik/vm/alloc/Heap.c 


486 
487 
488 


621 


641 
642 





void* dvmMalloc(size_t size, int flags) 
{ 
GcHeap *gcHeap = gDvm.gcHeap; 
DvmHeapChunk *hc; 
void *ptr; 


bool triedGc, triedGrowing; 


dvmLockHeap() ; 


hc = tryMalloc(size) ; 
if (hc != NULL) { 


ptr = hc->data; 


dvmUnlockHeap(); 


return ptr; 


在 第 540 行 锁定 VM Heap。 


在 第 544 行 调用 的 是 实际 执行 分 配 的 函数 ， 返 回 的 是 指向 结构 体 DymHeapChunk 的 指针 ， 








不 过 这 个 结构 体 里 只 有 用 于 debug 的 成 员 ， 因 此 我 们 没有 必要 特别 在 意 它 。 


在 第 $71 行 取出 实际 分 配 的 指针 ， 在 第 621 行将 VM Heap 解锁 ， 返 回 分 配 的 指针 。 
下 面 来 看 看 第 544 行 的 tryMalloc() 函数 。 省 略 掉 分 配 以 外 的 部 分 后 ,该 函数 也 变 得 非 


党 简单， 如 下 所 示 。 


dalvik/vm/alloc/Heap.c 


325 
326 
327 


350 
351 
352 
353 


406 





static DvmHeapChunk *tryMalloc(size_t size) 


‘ 
DvmHeapChunk *hc; 
hc = dvmHeapSourceAlloc(size + sizeof (DvmHeapChunk)); 
if (hc != NULL) { 
return hc; 
让 
} 


第 350 行 只 调用 了 dvmHeapSourceAlloc() 也 数 。 
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这 个 dvmHeapSourceAlloc() 函数 就 是 最 终 把 对 象 分 配给 DalvikVM 的 VM Heap 空间 的 


dalvik/vm/alloc/HeapSource.c 
652 | void * 
653 | dvmHeapSourceAlloc(size_t n) 
654 | 
655 HeapSource *hs = gHs; 
656 Heap *heap; 
657 void *ptr; 
660 heap = hs2heap (hs); 
661 
662 if (heap->bytesAllocated + n <= hs->softLimit) { 
666 ptr = mspace_calloc(heap->msp, 1, n); 
667 if (ptr != NULL) { 
668 countAllocation(heap, ptr, true); 
669 } 
670 小 
678 return ptr; 
679 | 上 





在 第 655 行将 全 局 变量 gHs 的 VM HeapSource 存 人 hs。 
在 第 660 行 调用 宏 hs2heap() ， 这 个 宏 的 定义 如 下 所 示 。 


dalvik/vm/alloc/HeapSource.c 
173 | #define hs2heap(hs_) (&((hs_)->heaps[0])) 


这 里 取出 了 VM HeapSource 的 heaps 的 第 0 个 元 素 。 如 11.5.5 节 中 所 述 ， 程 序 只 使 用 
VM HeapSource 开头 的 VM Heap， 而 这 部 分 进行 的 正 是 这 项 操作 。 也 就 是 说 ， 只 能 从 当前 活 
动 的 VM Heap 分 配对 象 。 

在 第 662 行 ， 把 当前 分 配 到 VM Heap 的 字 节 数 和 这 次 分 配 的 字 节 数 相 加 ， 确 认 其 结 
小 于 等 于 softLimit (DalvikVM 指定 的 软件 上 的 分 配 界限 )。 

第 666 行进 行 的 处 理 则 是 实际 从 VM Heap 分 配 内 存 空间 。mspace_calloc() 印 数 是 用 
dlmalloc 定义 的 函数 。 虽然 参数 多 多 少 少 有 些 不 同 , 不 过 其 功能 和 C 语言 的 calloc() 函数 
是 相同 的 ， 都 是 分 配 n 个 指定 的 大 小 ， 将 内 存 清 空 为 0 后 返回 其 开头 的 指针 。 在 dlmalloc 中 ， 
按照 惯例 会 把 msp (VM Heap ) 传递 给 第 1 个 参数 。 

此 外 ， 从 dlmalloc 分 配 的 指针 是 以 8 字 节 对 齐 的 。 也 就 是 说 ， 对 象 指 针 的 地 址 肯定 
的 倍数 。 这 是 一 个 重点 ， 请 大 家 牢 牢 掌握 。 
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图 11.16 ”从 VM Heap 分 配 


如 果 内 存 分 配 成 功 ， 我 们 就 在 第 668 行 调 用 countAllocation() 国 数 。 
11.5.9 ”标记 到 对 象 位 图 


那么 来 看 看 这 个 countAllocation() 函数 的 内 容 吧 。 
这 个 函数 的 任务 是 计数 ,“ 数 ” 指 的 是 分 配 到 VM Heap 的 字 节 数 和 对 象 数 。 








dalvik/vm/alloc/HeapSource.c 


243 | static inline void 

244 | countAllocation(Heap *heap, const void *ptr, bool is0bj) 

245 | { 

248 heap->bytesAllocated += mspace_usable_size(heap->msp, ptr) + 
249 HEAP_SOURCE_CHUNK_OVERHEAD ; 

250 if (isobj) { 

251 heap->objectsAllocated++; 

252 dvmHeapBitmapSet0bjectBit(&heap->objectBitmap, ptr); 

253 } 

256 | } 





请 大 家 注意 第 252 行 ， 当 countAllocation() 函数 的 第 3 个 参数 isobj 为 true 时 ， 就 会 
调用 avmHeapBitmapSet0bjectBit()。 

这 个 函数 就 如 它 的 名 字 一 样 ， 负 责 把 对 应 已 分 配对 象 的 对 象 位 图 表格 内 的 位 重 写成 1( 正 
在 分 配 的 标记 )。 也 就 是 说 ， 每 当 我 们 分 配对 象 时 ， 对 象 肯定 会 被 标记 到 对 象 位 图 。 

此 外 ， 当 要 把 对 象 以 外 的 东西 分 配 到 VM Heap 时 ,需要 把 countAllocation 函数 的 第 3 
个 参数 isobj 设置 为 false， 调 用 这 个 函数 。 在 这 种 情况 下 ,对象 以 外 的 东西 就 不 会 被 标记 
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到 对 象 位 图 。 因 为 GC 是 以 对 象 位 图 为 基础 运行 的 ， 所 以 这 时 位 于 VM Heap 内 的 对 象 以 外 的 
数据 肯定 在 CC 的 对 象 范围 之 外 。 
11.5.10 ”分配 实例 


接 下 来 让 我 们 一 起 看 看 如 何 把 由 类 生成 的 实例 分 配 到 DalvikVM 的 VM Heap 空间 。 负 责 分 配 
实例 的 函数 是 dvmAllocObject() 函数 。 这 个 函数 也 一 样 ， 省 略 掉 细 术 末 节 的 部 分 就 非常 简单 了 。 








dalvik/vm/alloc/Alloc.c 


134 | Object* dvmAllocObject(Class0Object* clazz, int flags) 
135 | { 

136 Object# new0bj; 

145 new0bj = dvmMalloc(clazz->objectSize, flags); 

146 if (new0bj != NULL) { 

4 DVM_O0BJECT_INIT(new0bj, clazz); 

154 } 

155 

156 return new0bj; 

157 | 了 





在 第 145 行 用 clazz->objectSize 获取 实例 的 大 小 。 这 个 objectSize 就 跟 它 的 名 字 一 样 ， 
是 类 生成 的 实例 的 大 小 ( 字 节 )。 

这 个 大 小 的 具体 内 容 是 “结构 体 object 的 大 小 加 上 实例 变量 的 大 小 ”。 
举 个 例子 ,假设 用 Java 代码 进行 如 下 定义 。 














// 类 定义 
public class Clazz { 
static public int memberl; 


static public int member2; 


基于 上 述 代 码 ， 这 个 类 的 实例 的 分 配 情况 如 下 图 所 示 。 


DataObject 


Object obj; 








实例 变量 | memberl (实例 变量 ) 
的 个 数 ”| member2 (实例 变量 ) 


图 11.17 分 配 实例 变量 
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在 第 147 行 调用 的 宏 DVM_0BJECT_INIT() 是 负责 初始 化 已 分 配对 象 的 宏 。 


dalvik/vm/oo/Object.h 
182 
183 


#define DVM_OBJECT_INIT(obj, clazz_) \ 





do { (obj)->clazz = (clazz_); DVM_LOCK_INIT(& (obj)->lock); }while (0) 


指向 结构 体 classobject 的 指针 被 作为 参数 传递 给 了 成 员 clazz (对 象 的 类 )。 此 外 还 要 
初始 化 成 员 lock (用 于 锁定 synchronized )， 不 过 这 部 分 内 容 跟 我 们 要 讲 的 无 关 ， 就 略 去 不 提 了 。 
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下 面 该 轮 到 GC 登场 了 。 大 家 都 还 记得 吧 ，DalvikVM 的 垃圾 回收 采用 的 是 GC 标记 - 清 
除 算法 。 这 一 厄 就 让 我 们 来 看 看 GC 标记 - 清除 算法 的 标记 部 分 是 如 何 实现 的 。 


11.6.1 ”启动 GC 的 时 机 


在 DalvikVM 中 ， 下 述 情况 下 GC 会 启动 。 


























1. VM Heap 没有 空闲 空间 ， 对 象 内 存 分 配 失败 时 
2. Java.lang.Runtime 的 gc() 方法 被 调用 时 


在 这 里 先 说 明 一 下 执行 GC 的 基本 函数 avmcollectGarbageInternal() 的 概要 吧 。 


dalvik/vm/alloc/Heap.c 























718 | void dvmCollectGarbageInternal(bool collectSoftReferences) 
719 | 区 
/* 停止 全 部 线程 */ 
762 dvmSuspendAllThreads (SUSPEND_FOR_GC) ; 
/* 调用 与 标记 相关 的 函数 群 : 标记 阶段 */ 
/* 调用 与 清除 相关 的 函数 群 : 清除 阶段 */ 
/* 启动 全 部 停止 的 线程 */ 
1011 dvmResumeAllThreads (SUSPEND_FOR_GC); 
1042 | } 




















停止 全 部 线程 ， 经 过 标记 阶段 和 清除 阶段 ， 启 动 停止 的 线程 。 虽然 真 的 只 是 概要 ,但 还 
是 希望 大 家 能 把 这 部 分 内 容 作 为 GC 的 流程 记 在 心里 。 





300 第 11 章 DalvikVM 的 垃圾 回收 


11.6.2 ”标记 的 顺序 
首先 来 简单 说 明 一 下 标记 的 顺序 。 虽 然 说 是 顺序 ， 也 只 是 分 成 两 个 步 又 而 已 。 
































1. 标记 从 根 引 用 的 对 象 
2. 搜索 已 标记 的 对 象 ( 标 记 ) 





下 面 就 来 逐个 看 一 下 它们 是 如 何 实现 的 吧 。 


11.6.3 ”保守 的 根 
这 里 先 介 绍 一 下 DalvikVM 里 的 根 。 


。 用 Java 定 义 的 类 

。 基 本 数据 类 型 (int、float、boolean 等 ) 
。JNI 的 全 局 引用 

。JNI 的 局 部 引用 (各 个 线程 ) 

。 等 待 最 终 化 的 对 象 

。GC 保 护 中 的 对 象 

。DalvikVM 中 的 寄存 器 (各 个 线程 ) 
。DalvikVM 中 的 调用 栈 (各 个 线程 ) 


补 全 基本 数据 类 型 的 话 ， 基 本 数据 类 型 的 定义 (int、float 等 ) 就 会 被 作为 对 象 分 配 到 
DalvikVM 的 VM Heap 空间 。 因 此 也 必须 将 其 作为 根 明 确 标记 。 

在 这 些 根 里 ， 我 们 解说 一 下 “VM 中 的 调用 栈 ”， 其 他 部 分 大 家 知道 “有 这 么 个 东西 ”就 
够 了 。 


11.6.4 DalvikVM 是 寄存 器 机 器 


VM 大 体 上 分 为 两 类 ， 一 类 是 寄存 器 机 器 ， 另 一 类 是 堆栈 机 器 。 
堆栈 机 器 不 使 用 寄存 器 ， 而 使 用 栈 进行 计算 。 















































7 记 


加 法 计算 结 呈 





11.18 ”堆栈 机 器 的 计算 示例 
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这 里 以 “1 十 2 = 3” 为 例 。 堆 栈 机 天 将 数值 堆积 到 栈 ， 然 后 从 这 个 栈 中 取出 数值 进行 计 
算 ， 并 将 结果 堆积 到 栈 。 
寄存 器 机 器 顾名思义 ， 是 使 用 寄存 器 的 计算 机 。 


| TT 
| PE 


图 11.19 寄存 器 机 器 的 计算 示例 
































寄存 器 机 器 则 将 数值 一 次 加 载 到 寄存 器 中 ， 然 后 将 存 人 寄存 器 的 值 加 起 来 得 出 计算 结果 。 
DalvikVM 中 采用 的 是 寄存 器 机 器 。 




















为 什么 DalvikV M 中 采用 的 是 寄存 器 机 器 ? 

现在 很 多 VM 都 采用 推 栈 机 器 ， 可 以 说 堆栈 机 器 成 为 了 当今 的 主流 。 在 这 种 情况 下 ， 为 什么 
DailvikVM 采用 的 却 是 寄存 器 机 器 呢 ? 顺便 提 一 句 ， 绝 大 部 分 JVM 都 采用 的 是 寄存 器 机 器 。 

之 所 以 做 出 这 样 的 决定 ， 事 实 上 也 有 着 Android 方面 特殊 的 原因 。 

那 就 是 Android 终端 的 处 理 器 采用 的 是 寄存 器 机 器 架构 。 如 果 VM 的 架构 也 同样 采用 寄存 器 
机 器 ， 那 么 在 VM 内 的 核心 运算 部 分 中 ， 机 器 内 部 寄存 器 的 直接 操作 就 更 加 简单 ， 由 此 就 能 在 一 
定 程度 上 提升 VM 的 运行 速度 。 
事实 上 ， 现 阶段 Android 终端 的 CPU 还 只 有 ARM，DalvikVM 把 目标 定 在 ARM 上 进行 最 





































































































\ 一 vv 一 


优化 (当今 的 开发 分 支 正 进行 着 开发 项 目 ， 试 图 达到 以 x86 也 能 运行 Android 的 目标 )。 

简单 来 说 ， 开 发 者 是 因为 重视 速度 而 采用 寄存 器 机 器 的 。 

从 源 代码 中 也 可 以 明显 看 出 其 意图 所 在 。dalvik/vm/mterp/README.txt 的 一 节 中 关于 VM 
的 核心 部 分 是 这 样 表述 的 。 

































































原来 的 版 本 的 核心 是 用 单独 的 C 语言 函数 实现 的 。 


但 为 了 提升 性 能 ， 开 发 者 将 这 些 全 用 汇编 语言 重 写 了 。 























确实 在 同一 目录 下 放 着 大 量 用 于 ARM 的 汇编 代码 。 这 样 一 来 就 能 追求 速度 上 的 提升 了 。 
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11.6.5 ”VM 的 调用 栈 
下 面 我 们 来 说 说 DalvikVM 的 调用 栈 的 结构 。 


在 每 次 调用 方法 时 ， 都 会 将 帧 堆积 到 调用 栈 。 这 个 帧 里 装 满 了 用 于 执行 方法 的 必要 信息 。 
在 DalvikVM 的 情况 下 ， 一 个 由 里 装着 以 下 两 个 信息 。 








.局 部 变量 


。 参数 


下 面 来 看 看 调用 帧 的 堆积 方法 吧 。 


低地 址 (0x00000000) 


管理 帧 的 结构 体 
局 部 变量 0 
帧 输出 0/ 参 数 0 
输出 1/ 参数 1 
管理 帧 的 结构 体 
局 部 变量 0 
局 部 变量 1 
帧 参数 0 
参数 1 
参数 2 

















用 的 帧 





















调用 方 的 帧 
































高 地 址 (OxfffffffD) 


图 11.20 ”VM 的 调用 栈 


大 一 


每 次 调用 方法 时 都 会 像 图 11.20 这 样 堆积 帧 ， 然 后 数据 会 按 方法 的 局 部 变量 一 参数 的 顺 

序 存 人 各 个 帧 内 。 

新 调用 方法 时 要 在 输出 n 中 设 定数 据 。 打 个 比方 ， 输出 0 对 应 新 调用 的 方法 的 参数 0。 

也 就 是 说 ,调用 参数 的 时 候 如 果 想 赋值 给 这 个 方法 的 参数 n， 就 要 对 输出 n 执行 赋值 操作 。 
关于 调用 栈 的 结构 和 方法 的 调用 结构 本 身 ， 即 使 不 能 深刻 理解 也 没有 关系 。 这 里 希望 大 

家 注意 的 是 这 个 帧 内 的 数据 ， 即 指向 对 象 的 指针 和 int 、f1oat 等 数值 Java 的 基本 数据 类 型 ) 


是 摊 杂 在 一 起 的 。 也 就 是 说 ， 即 使 里 面 有 指向 对 象 的 指针 这 样 的 非 指 针 (数值 )，GC 也 判别 
不 出 来 。 
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@@ 


为 什么 采用 保守 式 GC? 

DalvikVM 中 为 什么 采用 保守 式 GC 呢 ? 

就 像 之 前 在 第 6 章 中 所 说 的 那样 ， 准 确 式 GC 有 个 缺点 ， 那 就 是 比 起 保守 式 GC ， 一 般 情 ; 
下 语言 处 理 程序 的 整体 速度 较 慢 。 另 外 ， 因 为 DalvikVM 采用 的 是 GC 标记 - 清除 算法 ， 所 以 即 
使 采用 保守 式 GC 也 没什么 问题 。 我 们 现在 重视 语言 处 理 程序 的 速度 ， 才 采用 了 保守 式 GC。 

不 过 vm/alloc/HeapSource.c 第 484 行 的 注释 中 有 一 名 话 :“ 如 果实 现 了 压缩 …… “， 如 果 
能 实现 压缩 的 话 ， 离 DalvikVM 采用 正确 的 GC 那 一 天 或 许 就 不 远 了 。 
































11.6.6 ”初始 标记 


下 面 让 我 们 基于 上 述 内 容 来 看 看 执行 初始 标记 的 函数 。 
初始 标记 是 由 dvmHeapMarkRootSet () 函数 执行 的 。 这 里 我 们 把 用 不 着 的 部 分 砍 反 了 。 





dalvik/vm/alloc/MarkSweep.c 








313 | void dvmHeapMarkRootSet() 

314|{ 
/* 类 的 标记 */ 

324 dvmGcScanRootClassLoader(); 
/* 基本 数据 类 型 的 标记 */ 

326 dvmGcScanPrimitiveClasses(); 
/* 全 部 线程 的 标记 */ 

334 dvmGcScanRootThreadGroups (); 
/* JNI 的 全 局 变量 */ 

344 dvmGcMarkJniGlobalRefs(); 

380|} 





为 无 法 把 所 有 实现 都 看 一 遍 ， 所 以 在 此 只 为 大 家 介绍 dvumGcScanRootThreadGroups() 函数 
的 实现 。 
在 第 334 行 的 dqvmGcScanRootThreadGroups() 函数 内 部 对 所 有 线程 调用 gcscanThread() 函数 。 


dalvik/vm/Thread.c 


3190 | static void gcScanThread(Thread *thread) 
3191 | 
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3208 dvmMark0bject (thread->thread0bj ) ; 
3212 dvmMark0bject (thread->exception); 
3213 gcScanReferenceTable(&thread->internalLocalRefTable) ; 
3217 gcScanReferenceTable(&thread->jniLocalRefTable) ; 
3218 
3219 if (thread->jniMonitorRefTable.table != NULL) { 
3222 gcScanReferenceTable(&thread->jniMonitorRefTable); 
3223 了 
3224 
3227 gcScanInterpStackReferences (thread) ; 
3230 | } 
gcScanThread() 困 数 会 对 这 个 线程 执行 标记 操作 。 需要 大 家 注意 的 是 第 3227 行 的 


gcScanInterpStackReferences() 函数 。 

如 前 所 述 ， 调 用 栈 里 存 着 局 部 变量 和 参数 的 数据 。 因 为 这 些 确实 是 当前 正在 使 用 的 对 象 ， 
所 以 是 GC 的 根 。 

然后 实际 对 其 进行 标记 的 就 是 这 个 gcScanInterpStackReferences() 因数 。 


























dalvik/vm/Thread.c 


3130 
3131 
3132 
3133 
3134 
3135 
3136 
3137 
3138 
3139 
3140 
3141 


3150 
3151 
3152 


3154 
3155 
3156 
3157 





static void gcScanInterpStackReferences(Thread *thread) 
生 


const u4 *framePtr; 


framePtr = (const u4 *)thread->curFrame; 
while (framePtr != NULL) { 
const StackSaveArea *saveArea; 


const Method *method; 


saveArea = SAVEAREA_FROM_FP (framePtr); 
method = saveArea->method; 


if (method != NULL) { 


nb 
for (i = method->registersSize - 1; i >= 0; i--) 1{ 


u4 rval = *framePtr++; 


if (rval != 0 && (rval & 0x3) == 0) { 
dvmMarkIfObject((0bject *)rval); 


11.6 标记 阶段 
3158 了 
3166 framePtr = saveArea->prevFrame; 
3167 } 
3168 |} 








函数 做 的 事情 很 简单 ， 只 是 遍历 整个 调用 栈 ， 对 存 人 的 对 象 进行 标记 。 
we 
所 有 指向 取出 的 帧 内 对 象 的 指针 (局 部 变量 、 参 数 )。 
在 第 3166 行 遍 历 前 面 的 帧 (调用 方法 的 位 置 )， 继 续 标 记 。 
在 这 个 函数 中 需要 大 家 注意 的 是 第 3155 行 的 宏 dvmMarkIfobject()。 这 个 宏 实 际会 对 标 
记 位 图 执行 标记 操作 。 
这 样 一 来 初始 标记 就 对 所 有 的 根 进 行 了 标记 。 


11.6.7 ”位 图 的 标记 
在 了 解 位 图 的 实际 标记 过 程 之 前 ,我 们 先 来 看 看 位 图 表格 的 结构 吧 。 




















[L111 


图 11.21 位 图 结构 





之 前 已 经 解释 过 ， 位 图 是 一 个 有 着 32 位 元 素 的 数组 。 位 图 中 的 1 位 对 应 VM Heap 内 的 
8 个 字 节 。 在 dlmalloc 中 分 配 内 存 时 ， 为 了 确保 返回 用 8 个 字 节 对 齐 的 地 址 ， 就 要 把 位 图 的 
1 位 对 应 8 个 字 节 。 

了 解 了 以 上 内 容 之 后 ， 再 看 标记 的 实现 就 不 难 了 。 虽 然 通 过 了 各 种 各 样 的 路 径 ， 不 过 我 
们 最 终 还 是 调用 了 _heapBitmapModify0bjectBit() 函数 来 实现 位 图 表格 的 标记 。 

不 如 先 从 前 半 部 分 开始 看 吧 。 





























dalvik/vm/alloc/HeapBitmap.h:_heapBitmapModifyObjectBit(): 前 半 部 分 
unsigned long int 
_heapBitmapModifyO0bjectBit (HeapBitmap *hb, const void *obj, 
bool setBit, bool return01d) 
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202|{ 

203 const uintptr_t offset = (uintptr_t)obj - hb->base; 

204 const size_t index = HB_OFFSET_TO_INDEX(offset); 

205 const unsigned long int mask = HB_OFFSET_TO_MASK(offset); 


/* 后 半 部 分 */ 


第 203 行 负 责 计算 由 VM Heap 的 开头 到 指针 位 置 的 偏 移 。 

下 面 需要 求 位 图 的 索引 。 大 家 还 记得 吧 ， 位 图 表格 是 一 个 有 32 位 元 素 的 数组 。 

第 204 行 代码 所 进行 的 处 理 就 是 计算 位 图 的 索引 。 对 offset 调用 的 宏 HB_OFFSET_T0_ 
INDEX() 就 负责 这 部 分 操作 。 为 了 更 便于 读者 理解 ， 这 里 展开 了 一 部 分 在 内 部 使 用 的 宏 。 











dalvik/vm/alloc/HeapBitmap.h: 展开 一 部 分 宏 
29 | #define HB_OFFSET_TO_INDEX(offset_) \ 
((uintptr_t) (offset_) / 8 / 32) 


在 这 里 我 们 首先 将 offset_ 除 以 8。 因 为 位 图 的 1 位 对 应 8 个 字 节 ， 所 以 用 offset_ 除 
以 8 就 可 以 换算 成 位 图 上 的 偏 移 。 然 后 再 将 结果 除 以 32( 数 组 的 元 素数 量 )。 

这 样 就 能 够 计算 位 图 的 索引 了 。 

下 面 必 须 生 成 位 扼 码 (Bit mask ) 以 用 于 标记 。 负 责 生成 位 掩 码 的 正 是 宏 HB_OFFSET_T0_ 
MASK()。 为 了 方便 理解 ， 这 里 也 展开 一 部 分 在 内 部 使 用 的 宏 。 











dalvik/vm/alloc/HeapBitmap.h: 展开 一 部 分 宏 
37 | #define HB_OFFSET_TO_MASK(offset_) \ 


(1 << (31-(((uintptr_t) (offset_) / 8) % 32))) 





上 述 代码 的 处 理 流程 如 图 11.22 所 示 。 





a. 位 图 b. offset/ 8 (33) co b%32 cD 
bitz[0 es < bitzrl a 
nn rn au [TOTOTD) 
1tz won Se 
| ， 
offset =264 33 
d 31 (=30) e. 1<<d 


bitz[1] lolololo] +:- bitz[1] [oToToTo] .. . 
ae 


30 1 
[oTolo| …， 
完成 位 的 码 


图 11.22 生成 位 掩 码 
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可 见 图 中 的 offset_ 是 从 堆 开 头 到 标记 对 象 的 偏 移 。 首 先 将 offset_ 除 以 8 来 换算 位 图 
的 偏 移 ， 然 后 用 32 做 除法 。 这 样 一 来 就 能 求 出 索引 内 的 偏 移 了 ， 然 后 用 31 减 去 偏 移 值 ， 偏 
移 值 就 翻转 了 ， 这 样 就 能 计算 相对 对 象 位 的 偏 移 量 了 。 如 图 11.22 所 示 ， 计 算 求 得 的 偏 移 量 
为 da， 把 1 左 移 a 位 ， 位 掩 码 就 完成 了 ， 最 后 将 其 用 于 标记 位 图 元 素 。 

在 _heapBitmapModify0bjectBit() 函数 的 后 半 部 分 ， 将 以 计算 出 的 索引 和 位 掩 码 为 基础 
进行 标记 。 








dalvik/vm/alloc/HeapBitmap.h:_heapBitmapModifyObjectBit(): 后 半 部 分 





unsigned long int 
_heapBitmapModify0bjectBit (HeapBitmap *hb, const void *obj, 
bool setBit, bool return01d) 
/* 前 半 部 分 */ 

213 if (setBit) { 
214 if ((uintptr_t)obj > hb->max) { 
215 hb->max = (uintptr_t)obj; 
216 } 
217 if (return01d) { 
218 unsigned long int *p = hb->bits + index; 
219 const unsigned long int word = *p; 
220 *p |= mask; 
221 return word & mask; 
222 } else { 
223 hb->bits [index] |= mask; 
224 了 
225 } else { 
226 hb->bits[index] &= “mask; 
227 } 
228 return false; 
229|} 





事实 上 ， 这 个 函数 根据 参数 setBit 的 不 同 其 作用 也 大 有 变化 。 


1. 标记 位 图 ( 若 setBit 为 true ) 
2. 从 位 图 消去 标记 ( 若 setBit 为 false) 


首先 从 标记 开始 看 起 。 

在 第 217 行 ， 根据 return014 的 值 的 不 同 ， 所 进行 的 处 理 也 有 所 不 同 。 如 果 return01d 为 
false， 那 么 就 只 进行 标记 ， 也 就 是 第 223 行 的 处 理 ， 在 这 里 只 进行 了 标记 操作 。 位 运算 的 
流程 请 参考 图 11.23。 
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[1TofiTo| … hb->bits[index] 
OR 


[0111010| …， mask 





[1T1T110] :+…: hb->bits[index] 
被 标记 


图 11.23 标记 位 图 





当 第 217 行 的 return0ld 为 true 时 ， 则 返回 标记 以 前 的 值 。 也 就 是 说 ,标记 前 的 值 有 
两 种 情况 : 已 经 标记 了 ,或 者 尚未 标记 。 第 219 行 负责 把 位 图 的 元 素数 据 复制 到 变量 word， 
第 220 行 则 负责 实际 进行 标记 。 

下 面 是 消除 标记 的 操作 ， 这 项 操作 是 在 第 226 行 执 行 的 。 关 于 位 运算 的 流程 ， 请 参考 图 
11.246 


























LU .:- hb->bits[index] 


AND 


[Lo .…- mask 





[L110o1110| +: hb->bits[index] 
标记 被 消除 


11.24 ”消除 位 图 的 标记 

















这 里 所 讲 的 关于 标记 的 内 容 ， 对 于 对 象 位 图 和 标记 位 图 表格 是 通用 的 。 这 两 种 位 图 的 用 
途 虽 然 不 同 ， 但 结构 基本 一 致 。 

11.6.8 _ 区 别 非 指 针 和 指向 对 象 的 指针 

根 里 也 包含 int 和 float 等 非 指针 。 在 进行 初始 标记 的 时 候 ， 必 须 尽 量 不 让 这 些 非 指针 
成 为 标记 对 象 。 

DalvikVM 中 通过 检查 以 下 4 点 来 区 分 非 指针 和 指向 对 象 的 指针 。 如 果 能 通过 以 下 4 项 检查 ， 
程序 就 将 其 视 为 指向 对 象 的 指针 。 



































1. 不 为 0 

2. 是 8 的 倍数 (由 malloc 来 对 齐 指针 ) 
3. 指针 在 对 象 位 图 范围 内 

4. 对 应 了 指针 的 对 象 正 在 分 配 中 


























当然 还 是 可 能 存在 能 通过 上 述 考 验 的 非 指针 的 ， 即 “如 指针 一 样 的 非 指 针 ”。 遗 憾 的 是 ， 








T 
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以 现在 的 实现 来 说 ， 还 没 办 法 一 下 子 看 穿 这 样 的 非 指针 。 


这 里 面 的 第 3 点 和 第 4 点 貌似 很 有 意思 ， 我 们 就 来 看 看 这 部 分 的 实现 吧 。 





dvmHeapSourceContains() 水 数 负责 实际 的 检查 操作 。 这 个 函数 负责 检查 指针 是 否 在 位 


图 范围 内 。 
首先 来 一 起 看 看 前 半 部 分 吧 。 


dalvik/vm/alloc/HeapSource.c: 前 半 部 分 
792 | bool 
793 | dvmHeapSourceContains(const void *ptr) 
794|{ 
795 Heap *heap; 


799 heap = ptr2heap(gHs, ptr); 


第 799 行 的 ptr2heap() 函数 用 于 从 对 象 指针 的 地 址 获取 实际 分 配 到 对 象 的 VM Heap 的 


地 址 。 


dalvik/vm/alloc/HeapSource.c: 改变 一 部 分 


216 | static inline Heap * 
217 | ptr2heap(const HeapSource *hs, const void *ptr) 
218|{ 
219 const size_t numHeaps = hs->numHeaps; 
220 size_t i; 
221 
223 if (ptr != NULL) { 
224 for (i = 0; i < numHeaps; i++) { 
225 const Heap *const heap = &hs->heaps[il]; 
226 
if (ptr >= heap->objectBitmap->base && 
ptr <= heap->objectBitmap->max) { 
228 return (Heap *)heap; 
229 } 
230 } 
234 } 
2 return NULL; 
233 | 上 








我 们 展开 了 一 部 分 函数 ,这 样 就 看 得 更 明白 了 。 




















这 里 把 VM Heap Source 里 的 VM Heap 排序 ， 检 查 对 象 的 指针 是 否 在 VM Heap 范围 内 。 





虽然 是 线性 搜索 ， 不 过 因为 YM Heap 充其量 也 只 会 增加 到 3 个 ， 所 以 不 成 问题 。 
接 下 来 是 dqvmHeapSourceContains() 困 数 的 后 半 部 分 。 
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dalvik/vm/alloc/HeapSource.c: 后 半 部 分 


800 if (heap != NULL) { 

801 return dvmHeapBitmapIs0bjectBitSet(&heap->objectBitmap, ptr) != 0; 
802 了 

803 return false; 

804 | 上 





当 找 不 到 与 指针 对 应 的 VM Heap 时 ， 函 数 就 返回 false， 这 就 意味 着 判断 出 了 “这 是 非 
指针 ”。 

当 找 到 与 指针 对 应 的 VM Heap 时 ， 函 数 就 检查 指针 是 否 指 着 分 配 到 的 对 象 。 负 贡 执 行 
这 项 操作 的 是 第 801 行 的 aqvmHeapBitmapIs0bjectBitSet() 国 数 。 




















dalvik/vm/alloc/HeapBitmap.h 


304 


309 
310 
311 
312 
313 
314 
315 





dvmHeapBitmapIsObjectBitSet(const HeapBitmap *hb, const void *obj) 
攻 


if ((uintptr_t)obj <= hb->max) { 

const uintptr_t offset = (uintptr_t)obj - hb->base; 

return hb->bits [HB_OFFSET_TO_INDEX(offset)] & HB_OFFSET_TO_MASK (offset); 
} else { 


return 0; 





在 这 里 该 函数 将 确认 是 否 已 经 设置 了 对 应 指针 的 对 象 位 图 的 标志 位 。 因 为 分 配对 象 时 对 
象 肯定 会 被 标记 到 对 象 位 图 ， 所 以 在 这 里 如 果 没 有 设置 标志 位 的 话 ， 作 为 检查 对 象 的 地 址 肯 
定 会 指向 实 际 没有 得 到 分 配 的 对 象 。 函 数 就 会 判断 这 样 的 地 址 为 “ 非 指 针 ”。 

执行 这 项 操作 的 是 第 311 行 。 


11.6.9 ”搜索 对 象 


之 前 谈 的 一 直 都 是 初始 标记 的 问题 ,下面 就 为 大 家 说 明 如 何 用 初始 标记 搜索 已 标记 的 对 
象 ， 以 及 如 何 反复 标记 与 这 些 对 象 相关 的 对 象 。 
首先 是 实际 执行 GC 的 基本 函数 ， 我 们 只 抽出 其 中 的 标记 部 分 为 大 家 大 致 介绍 一 下 。 














dalvik/vm/alloc/Heap.c 


718 | void dvmCollectGarbageInternal(bool collectSoftReferences) 


719 | 攻 

720 GcHeap *gcHeap = gDvm.gcHeap; 
了 全 Object *softReferences; 

722 Object *weakReferences; 

723 Object *phantomReferences; 


11.6 标记 阶段 


/* 初始 标记 */ 
868 dvmHeapMarkRootSet (); 


/* 搜索 被 初始 标记 的 对 象 */ 


894 dvmHeapScanMarked0bjects() ; 


/* 清除 操作 : 省 略 */ 
1042 | } 




















我 们 用 这 个 dvmCollectGarbageInternal() R| 函数 来 执行 GC。 这 个 函数 是 个 长 达 300 行 的 
大 函数 ， 不 过 大 部 分 都 用 在 了 GC 的 配置 文件 和 debug 日 志 上 ， 所 以 其 内 容 本 身 并 不 是 很 大 。 

位 于 第 868 行 的 dvmHeapMarkRootSet() 函数 是 执行 初始 标记 的 函数 。 我 们 在 之 前 的 
11.6.8 节 中 已 经 说 明 过 这 个 函数 了 。 

接 下 来 要 看 的 是 第 894 行 的 dvmHeapScanMarked0bjects() 函数 。 它 是 以 初始 标记 为 基础 
执行 标记 操作 的 函数 。 

这 个 函数 的 层次 结构 很 复杂 ， 所 以 我 们 用 调用 图 来 表示 。 






































dvmHeapScanMarked0bjects() ”一 一 以 初始 标记 为 基础 搜索 对 象 
dvmHeapBitmapWalkList() 
dvmHeapBitmapWalk() 
dvmHeapBitmapXorWalk() 一 一 对 标记 完毕 的 对 象 调 用 回调 函数 
scanBitmapCallback() 一 一 回调 函数 
scan0bject() 一 一 搜索 对 象 的 成 员 ( 标 记 ) 


如 果 大 家 在 中 途 迷 路 了 ， 就 以 这 张 调 用 图 为 线索 向 着 正确 的 方向 前 进 


11.6.10 dvmHeapScanMarkedObjects() 
为 了 方便 讲解 ， 我 们 在 这 里 将 函数 分 成 前 半 部 分 和 后 半 部 分 。 


dalvik/vm/alloc/MarkSweep.c:dvmHeapScanMarkedObjects(): 前 半 部 分 
755 | void dvmHeapScanMarked0bjects() 


756 | 
757 GcMarkContext *ctx = 《&gDVvm.gcHeap->markContext ; 





在 第 757 行 取出 markContext。 这 是 指向 结构 体 GcMarkContext 的 指针 。 


dalvik/vm/alloc/MarkSweep.h 
40 | typedef struct { 
/* 标记 位 图 */ 
41 HeapBitmap bitmaps [HEAP_SOURCE_MAX_HEAP_COUNT] ; 
/* 标记 位 图 数 */ 
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42 size_t numBitmaps; 
43 GcMarkStack stack; 
44 const void *finger; 


45 | } GcMarkContext; 





GcMarkContext 就 如 它 的 名 字 一 样 ， 是 在 标记 的 时 候 使 用 的 ， 其 中 包含 着 标记 位 图 等 成 员 。 


dalvikvmyalloc/MarkSweep.c:dvmHeapScanMarkedObjects(): 后 半 部 分 


755 | void dvmHeapScanMarked0bjects() 
756 | { 
/* 前 半 部 分 */ 
767 dvmHeapBitmapWalkList(ctx->bitmaps, ctx->numBitmaps, 
768 scanBitmapCallback, ctx); 
773 processMarkStack(ctx); 
776.|.3 








第 767 行 的 qvmHeapBitmapWalkList() 函数 按照 VM Heap 地 址 由 低 到 高 的 顺序 ， 把 与 
VM Heap 对 应 的 所 有 标记 位 图 交 给 qvmHeapBitmapWalk() 印 数 。 

在 调用 的 avmHeapBitmapWalk() 函数 中 ， 我 们 不 对 获得 的 位 图 进行 任何 操作 ， 直 接 将 其 
交 给 dvmHeapBitmapXorWalk() 咀 数 。 此 外 ， 为 了 调用 这 个 孔 数 ， 我 们 还 需要 做 一 些 准 备 工作 。 

这 部 分 的 函数 很 无 聊 ， 而 且 讲 起 来 会 非常 元 长 ， 所 以 就 不 再 详 述 了 。 

下 面 来 为 大 家 说 明 avmHeapBitmapXorWalk() 函数 。 


11.6.11_ dvmHeapBitmapXorWalkO 
dvmHeapBitmapXorWalk() 函数 可 以 说 是 本 章 最 大 的 难点 。 因 为 这 部 分 内 容 很 难 ， 请 大 家 
细 细 阅读 每 个 主题 。 
这 个 函数 进行 的 操作 如 下 所 示 。 




















1. 寻找 位 图 内 的 标记 位 

2. 把 对 应 标记 位 的 对 象 存 入 缓冲 区 

3. 重复 1 和 2 直到 缓冲 区 被 填 满 

4. 当 缓 冲 区 满 时 ， 调 用 回调 函数 (gcanBitmapCallback() ) 
5. 对 位 图 内 进行 全 方位 的 搜索 ， 搜 索 完毕 即 结 来 


大 家 可 以 想象 “一 边 遍历 位 图 ,一边 把 被 标记 的 对 象 交 给 回调 函数 "， 这 样 一 来 脑海 中 
就 比较 容易 有 个 清晰 的 印象 了 。 大 家 也 看 到 了 ， 了 辑 数 的 名 字 里 有 个 Walk。 

同样 ， 想 必 大 家 也 很 在 意 函数 名 字 里 面 的 xor， 不 过 这 个 秘密 会 在 清除 阶段 为 大 家 揭晓 ， 
现在 先 放 下 它 不 管 吧 。 








接 下 来 差不多 该 解说 函数 内 部 了 。 这 个 函数 多 达 200 行 ， 所 以 
为 了 解说 起 来 方便 ， 我 们 简化 了 部 分 内 容 ， 不 过 操作 的 本 质 是 一 





11.6 标记 阶段 


分 成 4 部 分 来 说 明 。 此 外 ， 





dalvik/vm/alloc/HeapBitmap.c: dvmHeapBitmapXorWalk(): 定义 缓冲 区 


181 | bool 

182 | dvmHeapBitmapXorWalk(const HeapBitmap *hbi, const HeapBitmap *h 
183 bool (*callback) (size_t numptrs, void **ptrs, 
184 const void *finger, void *arg), 
185 void *callbackArg) 

186 | { 

187 static const size_t kPointerBufSize = 128; 

188 void *pointerBuf [kPointerBufSize] ; 

189 void **pb = PointerBuf ; 

190 size_t index; 

191 size_t i; 

192 























标记 阶段 中 完全 用 不 到 第 2 个 参数 hb2。 位 图 表格 也 是 虚拟 的 。 





的 。 


b2, 


那么 为 什么 有 这 个 参数 呢 ? 

















那 是 因为 之 后 要 讲 到 的 清除 阶段 中 会 用 到 这 个 函数 。 标 记 阶 段 中 需要 给 出 对 象 位 图 和 标记 位 
图 这 两 种 位 图 。 这 个 函数 的 调用 方 ， 即 qvmHeapBitmapWalk() 国 数 ， 只 生成 这 个 虚拟 的 位 图 


表格 。 
在 第 187 行 到 第 189 行 生 成 了 用 于 存 信 对象 指针 的 缓冲 区 。po 
pb 是 指向 pointerBuf 开头 元 素 的 指针 。 





dalvik/vm/alloc/HeapBitmap.c: dvmHeapBitmapXorWalk() 
277 index = 0; 


283 | const HeapBitmap *longHb; 
284 | unsigned long int *p; 


286 longHb = (hbi->max > hb2->max) ? hbl : hb2; 

287 i = index; 

288 index = HB_OFFSET_TO_INDEX(longHb->max - longHb->base); 
289 P = longHb->bits + i; 

290 for (/* i = i */; i <= index; i++) { 

292 unsigned long bits = *p++; 

293 DECODE_BITS (longHb, bits, true); 

294 } 

304 return true; 

305 


306 | #undef FLUSH_POINTERBUF 
307 | #undef DECODE_BITS 
308 | 上 








interBuf 是 缓冲 区 的 实体 ， 
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第 277 行 的 index 表示 的 是 位 图 的 开头 。 将 其 初始 值 设 定 为 0， 直到 第 287 行 ，index 
的 值 一 直 为 0。 

在 第 286 行 比 较 hbl 跟 hb2 的 max 值 ， 将 max 值 较 大 的 位 图 设 为 1ongHb。 不 过 hb2 是 虚 
拟 的 位 图 ， 其 max 被 设置 得 比 hl 小 ， 因 此 我 们 将 hl 设 定 为 longHb。 

第 288 行 用 于 获取 位 图 的 最 大 索引 。 

在 第 290 行 到 第 294 行 ， 我 们 按照 从 索引 o 到 最 大 索引 的 顺序 循环 ， 将 位 图 的 元 素 按 顺 
序 交 给 宏 DECODE_BITS () 。 

事实 上 这 个 宏 已 经 在 函数 内 被 定义 了 。 也 就 是 说 ， 宏 DECODE_BITS() 是 个 特定 的 宏 ， 只 
有 在 用 这 个 函数 时 才能 使 用 它 。 第 307 行 出 现 的 #undef 也 是 因为 这 个 原因 。 















































dalvik/vm/alloc/HeapBitmap.c: dvmHeapBitmapXorWalk(): DECODE_BITS() 


204 | #define DECODE_BITS(hb_, bits_, update_index_) \ 
205 do{\ 
if (bits_ != 0) {\ 
207 static const unsigned long kHighBit = \ 
208 (unsigned long)1 << 31; \ 
209 const uintptr_t ptrBase = HB_INDEX_TO_OFFSET(i) + hb_->base; \ 
212 while (bits_ != 0) {\ 
13 const int rshift = CLZ(bits_): \ 
214 bits_ &= ~ (kHighBit >> rshift); \ 
215 *pb++ = (void *) (ptrBase + rshift * 8); \ 
216 }\ 
220 FLUSH_POINTERBUF (ptrBase + 32 * 8); \ 
222 if (update_index_) { \ 
224 index = HB_OFFSET_TO_INDEX(hb_->max - hb_->base); \ 
225 BE 
227 FN 
228 } while (false) 





这 个 宏 乍 眼 一 看 会 让 人 一 避 ， 不 过 一 条 一 条 地 仔细 看 就 不 怎么 难 了 。 

来 试 着 整理 一 下 都 要 给 这 个 宏 哪 些 参 数 吧 。 首 先 hb_ 是 位 图 ，bits_ 是 位 图 内 的 元 素 ( 像 
0010010 这 样 的 位 串 )。 我 们 把 true 传递 给 update_index_o 

第 207 行 到 第 208 行 用 于 把 设置 了 32 位 中 的 开头 位 (1000..00) 的 正 数 (位 串 ) 设 定 给 
kHighBit。 

在 第 209 行 把 对 应 pits_ 开头 位 的 对 象 指 针 设 定 给 ptrBaseo 

在 第 212 行 一 直 循 环 执行 while 语句 ， 直 到 bits_ 等 于 0 为 止 。 

接 下 来 该 讲 mile 语句 的 内 容 了 。 我 们 在 第 213 行 的 宏 cLz() 中 调用 ARM 汇编 语言 的 
CLZ 命令 。cLz 会 从 位 串 的 开头 开始 数 o 连续 了 多 少 次 ， 并 返回 搜集 到 的 结果 。 这 样 一 来 我 
们 就 求 出 了 到 标记 位 为 止 的 右 偏 移 数 ， 然 后 将 其 存 入 rshift。 























[aS 


11.6 标记 阶段 


第 214 行 用 于 消除 在 第 213 行 查找 的 标记 位 。 
在 第 215 行 求 出 对 应 标记 位 的 对 象 指针 ,将 其 存 人 缓冲 区 。 这 项 操作 要 一 直 进 行 到 











bits_ 内 的 标记 全 都 消除 (也 就 是 变 成 0) 为 止 。 


在 第 220 行 调用 宏 FLUSH_POINTERBUF() ， 把 下 一 个 要 检查 标记 的 对 象 指针 传递 给 参数 。 
在 第 224 行 重 新 计算 index。 这 是 因为 回调 函数 可 能 害 hb_->max 增加 。 对 于 增加 的 部 分 ， 





也 必须 调用 宏 DECODE_BITS () 。 
下 面 来 看 一 下 宏 FLUSH_POINTERBUF () 。 


dalvik/vm/alloc/HeapBitmap.c: dvmHeapBitmapXorWalk(): FLUSH_POINTERBUF() 


193 
194 
195 
196 
197 
198 
199 
200 
201 
202 
203 





#define FLUSH_POINTERBUF (finger_) \ 
do{\ 
if (!callback(pb - pointerBuf, (void **)pointerBuf, \ 
(void *) (finger_), callbackArg)) \ 
{\ 
LOGW ("dvmHeapBitmapXorWalk: callback failed\n'"); \ 
return false; \ 
TAN 
pb = pointerBuf; \ 
} while (false) 


这 个 宏基 本 上 只 调用 回调 函数 。 计 算 机 把 存在 缓冲 区 里 的 对 象 指针 的 个 数 和 缓冲 区 自 





身 交 给 回调 函数 ， 此 外 还 把 下 一 个 要 标记 的 对 象 指 针 (finger_) 也 一 起 交 给 回调 函数 。 这 样 


scan0bject() 函数 就 愈 发 重要 了 ， 请 大 家 牢 牢 营 握 。 
到 这 里 最 难 的 内 容 就 结束 了 ， 之 后 就 简单 了 。 


11.6.12 scanBitmapCallback() 


回调 函数 原来 是 scanBitmapCallback() 困 数 ， 我 们 先 来 看 一 看 这 个 函数 。 





dalvik/vm/alloc/MarkSweep.c 


730 
731 
32 
733 


740 
741 
745 
746 
747 
748 
749 





scanBitmapCallback(size_t numPtrs, void **ptrs, const void *finger, void *arg) 
{ 
GcMarkContext *ctx = (GcMarkContext *)arg; 


size_t i; 
ctx->finger = finger; 


for (i = 0; i < numPtrs; i++) { 


scanDbject (chunk2ptr(*ptrs++), ctx); 


return true; 
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首先 用 dvmHeapBitmapXorWalk() 函数 设 定 了 标记 对 象 指针 ， 然 后 用 scan0bject () 困 数 
把 对 象 指 针 从 这 些 标记 对 象 指针 的 缓冲 区 中 一 个 个 取出 来 。scanBitmapCallback() 国 数 只 负 
责 调用 这 个 Scan0bject() 函数 。 

宏 chunk2ptr() 负责 向 下 偏 移 地 址 ， 地 址 偏 移 量 就 是 用 于 debug 的 头 (header) 的 量 。 

在 这 个 函数 里 大 家 最 应 该 注意 的 是 第 740 行 ， 参 数 finger 被 存 人 了 ctx->fingero 大 家 
应 该 还 记得 吧 ，finger 是 下 一 个 要 标记 检查 的 对 象 指针 。 


























finger 





党 
8 
家 


标记 检查 完毕 
堆 
图 11.25 finger 的 作用 








也 就 是 说 ，finger 负责 指示 现在 标记 到 了 哪里 ， 以 及 之 后 要 标记 哪里 。 


11.6.13 scanObject() 


ect() 因数 用 于 对 所 调用 的 对 象 内 的 成 员 执 行 标记 。 
函数 又 元 长 又 单调 ， 在 这 里 只 大 概 讲 一 下 。 大 家 只 要 知道 “这 个 函数 负责 标记 obj 
We 





dalvik/vm/alloc/MarkSweep.c 





510 | static void scan0bject(const Object *obj, GcMarkContext *ctx) 
511| 攻 
51412 ClassObject *clazz; 
513 
525 clazz = obj->clazz; 
/* 标记 obj 的 类 */ 
556 mark0ObjectNonNul1((Object *)clazz, ctx); 
560 if (IS_CLASS_FLAG_SET(clazz, CLASS_ISARRAY)) { 
563 if (IS_CLASS_FLAG_SET(clazz, CLASS_ISOBJECTARRAY)) { 
/* 数组 标记 操作 */ 


566 
567 


708 





11.6 标记 阶段 


scan0bjectArray((ArrayObject *)obj, ctx); 


} else { 


/* 实例 字段 标记 操作 */ 


scanInstanceFieldqs((Data0bject *)obj, clazz, ctx); 


/* 类 的 成 员 标 记 操 作 */ 

if (clazz == gDvm.classJavaLangClass) { 
scanClass0bject((Class0bject *)obj, ctx); 

} 


+ 


我 们 在 第 2 章 中 介绍 了 scan 函数 (搜索 函数 )， 它 负责 递归 地 搜索 堆 中 的 活动 对 象 ( 从 根 
到 对 象 ， 从 对 象 到 子 对 象 )。scan0bject() 函数 正 是 这 种 搜索 函数 。 

那么 我 们 是 否 真 的 对 子 对 象 递归 调用 了 scanobject() 函数 呢 ? 第 572 行 中 已 经 调用 了 
scanInstanceFields() 函数 ， 让 我 们 一 起 来 看 看 它 的 内 容 ， 确 认 一 下 吧 。 











dalvik/vm/alloc/MarkSweep.c 


430 
431 
432 
434 
435 
436 
437 
441 
442 
450 


451 
452 
456 
457 
458 





static void scanInstanceFields(const Data0bject *obj, ClassO0bject *clazz, 
GcMarkContext *ctx) 
下 
while (clazz != NULL) { 
InstField *f; 


站 讽 韦 ， 计 必 


f = clazz->ifields; 
for (i = 0; i < clazz->ifieldRefCount; i++) { 
mark0bject(dvmGetFieldO0bject((0bject*)obj, f->byte0ffset), 
ctx); 
下 二 十 了 


clazz = clazz->super; 


有 

















不 过 如 大 家 所 见 ，scanInstanceFields() 函数 只 是 在 第 441 行 把 对 象 内 的 实例 字段 取出 
来 ， 并 传递 给 了 markobject() 函数 而 已 。markobject() 函数 只 负责 设置 从 参数 接收 到 的 对 
象 的 标记 位 。 调 用 了 scan0bject() 函数 的 地 方 是 无 论 如 何 也 找 不 到 的 。 

没 错 ， 其 实 DalvikVM 的 垃圾 回收 是 不 会 递归 地 进行 标记 的 。 

可 是 问题 来 了 ， 这 样 一 来 本 该 被 标记 的 对 象 不 就 标记 不 到 (标记 遗漏 ) 了 吗 ? 
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请 大 家 考虑 一 下 下 面 这 个 例子 。 假 设 对 象 A 的 成 员 里 包括 对 象 B， 对 象 C 是 对 象 B 的 
子 对 象 。 请 看 图 11.26， 可 见 即 使 对 对 象 A 调用 scanobject() 函数 ， 对 象 C 也 没有 被 标记 。 





scanObject (对 象 A) 


11.26 对象 C 没 有 被 标记 


那么 ， 对象 C 什么 时 候 才 会 被 标记 呢 ? 

这 里 希望 大 家 回忆 一 下 dvmHeapBitmapXorWalk() 函数 ,我 们 在 这 个 函数 中 看 见 了 位 图 的 位 ， 
然后 才 调 用 的 这 个 scan0bject() 函数 对 吧 。 刚 才 例 子 中 出 现 的 对 象 B 已 经 被 标记 了 ， 因 此 
将 来 应 该 会 通过 dvmHeapBitmapXorWalk() 函数 对 对 象 B 调用 scan0bject() 函数 。 也 就 是 说 ， 
对 象 C 肯定 会 被 标记 。 大 家 看 一 下 图 11.27 就 会 明白 最 后 是 如 何 对 对 象 B 调用 scan0bject() 
的 。 









































标记 位 图 





dvmHeapBitmapXorWalk() 
> 


Jololm ololo of lololo bolojolololololo 











©@®_@ 
A B 


dvmHeapBitmapXorWalk() 
eg 


scanObject (对 象 A) 








scanObject (对 象 B) 


11.27 ”经 过 dvmHeapBitmapXorWalk() 标 记 

















这 里 细心 的 读者 可 能 已 经 发 现 了 ， 事 实 上 通过 dvmHeapBitmapXorWalk() 标 
现 漏 掉 标 记 检 查 的 情况 。 

请 看 图 11.28。 对 象 A 的 子 对 象 , 也 就 是 对 象 B 的 位 置 要 比 A 靠 前 。 也 就 是 说 ， 当 
dvmHeapBitmapXorWalk() 标记 对 应 B 的 位 时 ,标记 位 还 没 被 设置 。 因 此 ， 可 见 没 有 对 对 象 B 
调用 scan0bject()， 对 象 C 也 就 没 被 标记 。 

















标记 位 图 


dvmHeapBitmapXorWalk() 
> 








scanObject (对 象 A) 


v 


dvmHeapBitmapXorWalk() 
> 









还 是 没 被 
标记 吗 ? 














scanObject 没有 被 调用 ! 











图 11.28 ”对象 C 还 是 没 被 标记 吗 
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记 时 有 可 能 出 





在 这 里 就 该 轮 到 scanBitmapCallback() 中 出 现 过 的 finger 闪 亮 登场 了 。 因 为 finger 记 
着 标记 到 了 哪里 ， 所 以 当 要 标记 的 对 象 比 finger 所 指向 的 地 址 位 置 要 低 的 时 候 ， 就 可 知 这 





个 对 象 已 经 通 











过 了 dvmHeapBitmapXorWalk() 的 标记 检查 。 


因此 暂且 把 这 个 对 象 指 针 堆 到 结构 体 GcMarkContext 的 stack (标记 栈 ) 里 。 








dalvik/vm/alloc/MarkSweep.h 


40 | typedef struct { 


41 HeapBitmap bitmaps [HEAP_SOURCE_MAX_HEAP_COUNT] ; 
42 size_t numBitmaps; 
43 GcMarkStack stack; 
44 const void *finger; 


45 | } GcMarkContext; 
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顾名思义 ， 结 构 体 GcMarkstack 拥有 栈 结构 。 在 dvmHeapBitmapXorWalk() 的 位 图 标记 检 
查 结束 后 ， 被 堆 到 stack 的 对 象 指针 会 被 重新 交 给 scan0bject() 函数 。 


11.6.14 processMarkStack() 
那么 上 一 节 中 堆积 到 标记 栈 的 对 象 要 在 哪里 进行 标记 呢 ? 让 我 们 先 回头 看 一 下 
dvmHeapScanMarked0bjects() 函数 的 内 容 吧 。 





dalvikvmyalloc/MarkSweep.c:dvmHeapScanMarkedObjects(): 后 半 部 分 


755 
756 


767 


768 


773 


776 





void dvmHeapScanMarked0bjects() 





‘ 
/* 之 前 一 直 在 讲 的 函数 */ 
dvmHeapBitmapWalkList(ctx->bitmaps, ctx->numBitmaps, 
scanBitmapCallback, ctx); 
/* 处 理 标 记 栈 */ 
processMarkStack(ctx); 
} 

















在 此 调用 processMarkStack() 函数 ， 通 过 它 来 标记 标记 栈 内 的 对 象 。 


dalvikvmy/alloc/MarkSweep.c 


710 
7 
712 
了 3 


719 
720 
721 
722 
了 23 





static void 


processMarkStack(GcMarkContext *ctx) 


{ 
const Object **const base = ctx->stack.base; 
ctx->finger = (void *)ULONG_MAX; 
while (ctx->stack.top != base) { 
Scan0bject(#ctX->stacK.top++，ctx) ; 
3 
} 


第 719 行 负责 把 ULONG_MAX 设 定 给 finger。 这 个 宏 里 定义 了 unsigned long 型 的 最 大 正 数 。 

从 第 720 行 到 第 722 行 的 部 分 负责 把 堆积 在 标记 栈 里 的 对 象 进 行 标记 。scanobject() 函 
数 不 会 递归 地 标记 对 象 的 成 员 。 但 因为 finger 里 存 着 unsigned long 型 的 最 大 正 数 ， 所 以 
新 的 对 象 指 针 会 不 断 被 追加 到 标记 栈 中 。 只 要 在 追加 过 程 结束 之 前 一 直 调 用 scan0bject()， 
我 们 就 不 会 漏 掉 任 何 一 个 该 标记 的 对 象 。 
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| 


标记 栈 


比 finger 所 指向 的 地 址 位 置 低 的 所 有 地 址 了 
胰 








scanObject (对 象 A) 


下 


| 


标记 栈 





scanObject (对 象 B) 


图 11.29 对 堆积 到 标记 栈 里 的 对 象 进行 标记 


这 里 大 家 要 问 了 :“ 为 什么 不 使 用 递归 标记 呢 ? ” 

对 象 之 间 形 成 了 树 形 结构 ， 我 们 采用 递归 标记 操作 不 是 更 简单 吗 ? 

答案 是 这 会 造成 “ 栈 溢出 ”。 

在 每 次 调用 C 语言 的 函数 时 ， 帧 都 会 被 堆积 到 调用 栈 中 。 不 过 如 果 对 象 有 着 非常 复杂 的 
树 形 结构 ， 那 么 通过 函数 的 递归 ， 就 会 有 惊人 数量 的 帧 被 堆积 到 调用 栈 中 。 

我 们 并 不 能 无 限 地 往 调 用 栈 里 堆积 帧 ,一 旦 超过 上 限 ， 就 会 发 生 栈 洪 出 ， 引 发 错误 。 

在 DalvikVM 中 ， 为 了 避免 出 现 这 个 栈 溢出 的 问题 ， 在 标记 操作 中 不 使 用 递归 ， 而 是 尽 
量 不 去 扩充 栈 。 

此 外 ， 至 于 不 使 用 递归 标记 的 另 一 个 原因 ， 请 参看 4.3.3 节 。 
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11.7 


标记 阶段 之 后 是 清除 阶段 。 清 除 阶段 中 要 释放 没有 打上 标记 的 非 活动 对 象 。 
11.7.1 “在 清除 之 前 


在 实际 阅读 清除 阶段 的 代码 之 前 ， 让 我 们 先 来 一 起 想象 一 下 ， 该 如 何以 之 前 介绍 的 代码 
为 基础 执行 清除 呢 ? 

首先 ， 对 象 位 图 内 记录 了 分 配 到 VM Heap 内 的 对 象 。 

男 外 ， 标 记 位 图 内 记录 了 其 中 的 活动 对 象 。 

清除 操作 首先 必须 找到 释放 对 象 ， 也 就 是 非 活动 对 象 。 由 以 上 信息 可 知 ， 如 果 把 对 象 位 
图 和 标记 位 图 适当 地 取 差 分 ， 应 该 很 容易 就 能 找到 非 活 动 对 象 了 。 














对 象 位 图 标记 位 图 非 活 动 对象 的 位 图 
monn on on ES oo 
En ol em .Do LTomto] :+. [ofol 


图 11.30 两 个 位 图 的 差分 





11.7.2 ”开始 清除 


清除 阶段 和 标记 阶段 一 样 ， 都 是 以 aqvmCollectGarbageInternal() 图 数 开 始 的 。 





dalvik/vm/alloc/Heap.c 





718 | void dvmCollectGarbageInternal(bool collectSoftReferences) 
719 | 攻 
720 GcHeap *gcHeap = gDvm.gcHeap; 
守 放 坟 Object *softReferences; 
722 Object *weakReferences; 
23 Object *phantomReferences; 
/* 标记 操作 : 省略 */ 
/* 清除 操作 */ 
962 dvmHeapSweepUnmarked0bjects (&numFreed，&sizeFreed) ; 
1042 | } 




















dvmHeapSweepUnmarked0bjects() 是 实际 执行 清除 操作 的 函数 。 
函数 的 调用 图 如 下 所 示 。 
































11.7 清除 阶段 
dvmHeapSweepUnmarked0bjects() 一 一 获取 两 个 位 图 
dvmHeapBitmapXorWalkLists() 调用 dvmHeapBitmapXorWalk() 
dvmHeapBitmapXorWalk() 一 一 取 位 图 之 间 的 差分 
sweepBitmapCallback() 一 一 回调 函数 
dvmHeapSourceFree() 一 一 释放 非 活动 对 象 


清除 阶段 中 也 用 到 了 之 前 解说 过 的 aqvmHeapBitmapXorWalk() 函数 。 只 要 大 家 认真 阅读 了 
标记 阶段 ， 就 不 难 理解 清除 阶段 了 。 


11.7.3 _ dvmHeapSweepUnmarkedObjects( 
这 个 函数 负责 获取 对 象 位 图 和 标记 位 图 。 这 次 也 省 略 了 操作 中 细 枝 未 节 的 部 分 。 


dalvik/vm/alloc/MarkSweep.c 




















1281 | void 
1282 | dvmHeapSweepUnmarked0bjects(int *numFreed, size_t *sizeFreed) 
1283 | 工 
1284 const HeapBitmap *markBitmaps; 
1285 const GcMarkContext *markContext; 
1286 HeapBitmap objectBitmaps [HEAP_SOURCE_MAX_HEAP_COUNT] ; 
1289 size_t numBitmaps; 
1290 
1302 markContext = &gDvm.gcHeap->markContext; 
/* 获取 标记 位 图 */ 
1303 markBitmaps = markContext->bitmaps; 
/* 获取 对 象 位 图 */ 
1304 numBitmaps = dvmHeapSourceGet0bjectBitmaps(objectBitmaps ， 
1305 HEAP_SOURCE_MAX_HEAP_COUNT) ; 
1318 dvmHeapBitmapXorWalkLists(markBitmaps, objectBitmaps, numBitmaps, 
1319 sweepBitmapCallback, NULL); 
1332 |} 





第 1303 行 负责 获取 标记 位 图 链表 , 第 1304 行 到 第 1305 行 负责 获取 对 象 位 图 链表 。 
numBitmaps 表示 的 是 链表 内 位 图 表格 的 数量 。 因 为 每 个 VM Heap 都 有 一 个 位 图 表格 ， 所 以 
这 个 值 大 多 数 情 况 下 为 2 或 3。 

接 下 来 将 准备 好 的 位 图 表格 链表 传递 给 dvmHeapBitmapXorWalkLists() 国 数 。 
在 dvmHeapBitmapXorWalkLists() 函数 中 要 做 的 只 是 将 位 图 表格 链表 分 类 , 交 给 
dvmHeapBitmapXorWalk() 函数 。 关 于 此 函数 的 说 明 这 里 就 省 略 了 。 
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11.7.4 _ dvmHeapBitmapXorWalk( 

es ods 过 在 清除 阶段 中 它 的 用 处 略 有 不 同 。 

在 此 将 两 个 位 图 作为 参数 传递 Re tee 在 标记 阶段 中 ， 两 者 中 
有 一 个 (位 图 表格 ) 是 有 所 的 ， 于 是 对 应 另外 一 个 位 图 中 的 标记 调用 了 回调 二 数 ， 另 一 方面 ， 
在 清除 阶段 中 则 把 对 象 位 图 和 标记 位 图 两 者 作为 参数 传递 。 这 种 情况 下 是 对 两 个 位 图 表格 的 
差分 标记 调用 回调 函数 的 。 

由 于 我 们 已 经 讲 过 了 这 个 函数 的 大 部 分 内 容 ， 因 此 下 面 就 把 精力 放 在 如 何 求 差 分 上 吧 。 



































dalvik/vm/alloc/HeapBitmap.c 


181 
182 
183 
184 
185 
186 


256 
257 
258 
259 
261 
262 
263 
264 
265 
267 
268 
270 





bool 
dvmHeapBitmapXorWalk(const HeapBitmap *hbi, const HeapBitmap *hb2, 


bool (*callback) (size_t numptrs, void **ptrs, 
const void *finger, void *arg), 
void *callbackArg) 
{ 

/* 省 略 */ 

unsigned long :int *pl, *p2; 

uintptr_t offset; 

offset = ((hbi->max < hb2->max) ? hb1->max : hb2->max) - hbi->base; 

index = HB_OFFSET_TO_INDEX (offset); 

pil = hb1->bits ; 

p2 = hb2->bits ; 

for (i = 0; i <= index; i++) { 
unsigned long int diff = *pl++ ~ *p2++; 
DECODE_BITS (hb1，diff，false) ; 

上 

/* 省 略 */ 


把 对 象 位 图 传递 给 参数 hb1， 把 标记 位 图 传递 给 参数 hb2。 
在 第 261 行 求 位 图 开头 的 index。 




















在 第 267 行 比较 两 个 位 图 内 的 元 素 ， 把 指针 移动 到 下 一 个 元 素 。 这 部 分 是 重 中 之 重 ， 可 





见 比较 元 素 的 时 候 使 用 的 是 “*”(XOR ) 运算 符 。 








XOR 有 个 特性 ， 那 就 是 “如 果 两 个 位 是 同 值 则 返回 0， 如 果 不 为 同 值 则 返回 1”。 可 以 说 


正好 契合 我 们 这 次 的 目的 。 
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[oo ..: objectBitmaps[0] 


XOR 


[olofol1| …， markBitmaps[0] 





[olollo| … 
标记 了 非 活动 对 象 的 位 捉 





图 11.31 通过 XOR 比较 位 图 


像 这 样 把 生成 的 位 串 传递 给 宏 DECODE_BITS()， 非 活动 对 象 就 会 被 存 人 缓冲 区 内 ， 人 然后 
回调 函数 就 会 被 调用 。 


11.7.5 _ sweepBitmapCallback() 
这 个 函数 是 从 qvmHeapBitmapXorWalk() 函数 调用 的 。 该 函数 把 装 入 缓冲 区 的 对 象 指针 传 
递 给 参数 。 跟 标记 阶段 的 不 同 之 处 在 于 ， 所 传递 的 对 象 指针 都 是 “ 非 活 动 " 的。 此 外 ， 在 清 
除 阶 段 完全 不 使 用 fingero 




















dalvik/vm/alloc/MarkSweep.c 


1192 | static bool 
1193 | sweepBitmapCallback(size_t numPtrs, void **ptrs, 
const void *finger, void *arg) 
1194 |{ 
1196 size_t i; 
1197 
1198 for (i = 0; i < numPtrs; i++) { 
1199 DvmHeapChunk +*hc; 
1200 Object *obj; 
1205 hc = (DvmHeapChunk *)*ptrst++; 
1206 obj = (0bject *)chunk2ptr (hc); 
/* 释放 对 象 内 连接 的 数据 */ 
1262 dvmHeapSourceFree (hc); 
1263 } 
1264 
1265 return true; 
1266 | } 





在 这 些 指 针 指 向 的 对 象 内 ， 有 时 会 连接 不 被 DalvikVM 视 作 GC 对 象 的 数据 。 这 些 数据 
会 和 对 象 一 并 释放 。 说 到 这 里 就 烦琐 了 ， 所 以 我 们 就 不 多 提 了 。 
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实际 上 从 DalvikVM 的 VM Heap 内 释放 对 象 的 是 第 1262 行 的 dvmHeapSourceFree() 限 数 。 


11.7.6。 dvmHeapSourceFreeb 
接 下 来 就 来 看 看 dvmHeapSourceFree() 函数 。 我 们 把 “指向 非 活动 对 象 的 指针 ” 交 给 这 个 








函数 。 
dalvik/vm/alloc/HeapSource.c: dvmHeapSourceFree(): 前 半 部 分 
770 | void 
771 | dvmHeapSourceFree(void *ptr) 
772 | 去 
773 Heap *heap; 
774 
777 heap = ptr2heap(gHs, ptr); 
778 if (heap != NULL) { 
/* 从 对 象 位 图 消去 标记 */ 
779 countFree(heap, ptr, true); 
/* 后 半 部 分 */ 
787 | 上 





第 779 行 负 责 调 用 countFree() 函数 。 


dalvik/vm/alloc/HeapSource.c 


258 | static inline void 

259 | countFree(Heap *heap, const void *ptr, bool is0bj) 

260 |{ 

261 Size_t delta; 

262 

263 delta = mspace_usable_size(heap->msp, ptr) + HEAP_SOURCE_CHUNK_OVERHEAD; 
265 if (delta < heap->bytesAllocated) { 

266 heap->bytesAllocated -= delta; 

267 } else { 

268 heap->bytesAllocated = 0; 

269 了 

270 if (is0bj) { 

271 dvmHeapBitmapClearO0bjectBit (&heap->objectBitmap, ptr); 
272 if (heap->objectsAllocated > 0) { 

273 heap->objectsAllocated--; 

274 本 

275 } 

276|} 
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这 个 函数 的 意义 和 countAllocation() 函数 正 相 反 。countAllocation() 函数 对 VM 
Heap 内 分 配 的 对 象 的 字 节 数 和 对 象 数量 执行 了 递增 计数 ， 而 countFree() 函数 则 对 字 节 数 
和 对 象 数量 执行 递减 计数 。 

此 外 , 在 第 271 行 调用 了 dvmHeapBitmapClear0bjectBit() 函数 。 这 个 函数 负责 从 对 象 
位 图 消去 标记 。 因 为 要 释放 对 象 ， 所 以 这 再 理所当然 不 过 了 。 
dalvik/vm/alloc/HeapSource.c: dvmHeapSourceFree(): 后 半 部 分 


770 | void 
771 | dvmHeapSourceFree(void *ptr) 





/* 前 半 部 分 */ 





783 if (heap == gHs->heaps) { 

/* 释放 内 存 (dlmalloc) */ 
784 mspace_free(heap->msp, ptr); 
785 上 
786 } 


第 784 行 负责 从 DalvikVM 的 VM Heap 释放 对 象 。 
这 下 清除 阶段 就 结束 了 。 


11.8 


最 后 以 答疑 形式 来 复习 一 下 DalvikVM 的 垃圾 回收 。 


11.8.1 _ 终结 器 是 什么 ? 
通过 GC， 垃 圾 对 象 通常 都 会 被 从 内 存 释放 ， 不 过 对 于 那些 定义 有 终结 器 的 对 象 ， 则 要 
将 其 设 定 为 “等 待 最 终 化 执行 ”" 来 保留 内 存 释放 。 

实际 上 负责 寻找 “等 等 最 终 化 执行 ”的 对 象 ， 并 执行 最 终 化 的 是 一 个 叫 作 HeapWorker 的 
线程 。 一 旦 DalvikVM 启动 ， 就 必定 会 生成 线程 HeapWorker。 

再 往 详 细 说 就 超出 了 本 书 的 范围 ， 所 以 就 不 予 获 述 了 。 有 兴趣 的 读者 可 以 查阅 vm/alloc/ 
HeapWorker.c。 


11.8.2 ”为 什么 要 准备 两 个 位 图 ? 
DalvikVM 中 准备 了 以 下 两 个 位 图 。 
































1. 对 象 位 图 
2. 标记 位 图 
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然而 有 必要 准备 两 个 位 图 吗 ? 只 准备 出 一 个 标记 位 图 ， 之 后 在 DalvikVM 的 VM Heap 内 
进行 搜索 不 就 行 了 吗 ? 

大 家 想 想 清除 阶段 ， 这 个 问题 自然 就 有 答案 了 。 在 准备 了 两 个 位 图 的 情况 下 ， 清 除 时 用 
XOR 求 出 对 象 位 图 和 标记 位 图 的 差分 ， 之 后 只 要 基于 这 个 结果 释放 “ 非 活动 对 象 ” 就 可 以 了 。 

可 是 如 果 只 准备 了 标记 位 图 的 话 ， 搜 索 “ 非 活动 对 象 ”就 没 那 么 容易 了。 如 果 要 在 对 象 
已 经 被 分 配 了 的 情况 下 找 出 非 活动 对 象 ， 就 必须 搜索 整个 VM Heap。 这 样 一 来 ,缓存 就 脏 了 ， 
从 速度 上 来 说 也 很 不 利 。 


11.8.3 ”碎片 化 的 问题 是 ? 


DalvikVM 的 垃圾 回收 中 是 不 执行 压缩 的 。 也 就 是 说 ，VM Heap 有 发 生 碎片 化 的 潜在 可 能 。 

不 过 拿 到 现在 来 说 这 已 经 不 是 什么 大 问题 了 。 话 虽 如 此 ，DalvikVM 的 VM Heap 的 分 配 
和 释放 都 完全 交 给 了 dlmalloc 负责 ， 而 不 是 由 DalvikVM 来 管理 的 。 

因为 开发 者 已 经 对 dlmalloc 实施 了 优秀 的 碎片 化 对 策 ， 所 以 能 把 VM Heap 空间 的 碎片 
化 压 到 最 低 程 度 。 这 可 以 说 是 将 GC 和 malloc 两 者 有 效 结合 的 结 


11.8.4 “为 什么 要 采用 位 图 标记 ? 


为 什么 要 采用 位 图 标记 呢 ? 

关于 这 点 ， 就 要 说 到 在 第 2 章 中 提 到 过 的 写 时 复制 技术 了 。 

Android 的 应 用 程序 都 是 从 Zygote fork() 的 进程 。 在 启动 Android 时 ，Zygote 会 把 执行 
应 用 程序 所 必需 的 数据 分 配 到 用 于 Zygote 的 VM Heap 中 。 

应 用 程序 只 对 用 于 Zygote 的 VM Heap 执行 读 取 操作 。 也 就 是 说 ， 对 应 用 程序 进程 而 言 ， 
用 于 Zygote 的 VM Heap 是 放置 在 共享 空间 里 的 。 

但 是 在 没有 使 用 位 图 的 标记 阶段 中 ， 为 了 进行 标记 ， 对 象 会 被 直接 写 和 信 ， 这 时 就 会 发 生 
写 时 复制 ， 这 样 一 来 放置 在 共享 空间 的 内 存 空 间 就 会 被 复制 到 进程 的 私有 空间 里 。 

为 了 防止 这 一 点 ， 我 们 只 从 对 象 那里 拿 走 标记 位 ， 将 其 用 位 图 的 形式 来 表示 。 

不 过 ， 如 果 比 较 一 下 单纯 的 标记 和 位 图 标记 ， 就 会 发 现 位 图 标记 在 速度 上 再 怎么 样 都 比 
单纯 的 标记 慢 一 段 ， 即 通过 对 象 的 地 址 搜索 位 图 位 置 这 一 段 。 

不 过 Android 终端 的 资源 是 有 限 的 。 我 们 用 附属 于 AndroidSDK 的 终端 模拟 需 进 行 了 确认 ， 
发 现 能 用 模拟 器 使 用 的 内 存 空间 是 64M 字 节 ， 仅 仅 启 动 终端 ， 看 着 HOME 页 面 ( 闲 置 状态 ) 
就 差不多 使 用 了 40M 字 节 。 也 就 是 说 ， 应 用 程序 能 使 用 的 内 存 空间 大 小 只 有 20M 字 节 。 

基于 以 上 这 种 Android 的 特殊 情况 ， 从 节约 内 存 的 角度 出 发 ， 开 发 者 也 会 选择 采用 位 图 
标记 吧 。 因 为 比 起 速度 ， 人 们 往往 更 注重 空间 效率 。 

不 过 据说 NTT DOCOMO 发 售 的 HT-03 的 内 存 空 间 有 90M 字 节 ， 因 此 在 不 远 的 将 来 ， 
内 存量 或 许 会 有 些 改善 吧 。 















































































































































本 章 将 为 大 家 讲解 Rubinius 这 种 语言 处 理 程序 的 垃圾 回收 。Rubinius 属于 为 数 不 多 
的 Ruby 处 理 系统 中 的 一 种 。 


RE 
AQ= 人 
A rn 这 


PN 间 本 章 前 言 


在 阅读 垃圾 回收 之 前 ， 我 们 先 来 简单 介绍 一 下 Rubinius。 关 于 Ruby 的 语言 知识 在 “附录 
中 会 有 介绍 ， 不 知道 Ruby 的 人 建议 先 读 一 下 这 部 分 。 








12.1.1 ”什么 是 Rubinius 


Ruby 的 处 理 程序 中 最 有 名 的 就 是 以 松本 行 弘 为 中 心 开 发 的 CRuby (用 C 语言 写 的 Ruby)。 
大 家 可 以 这 样 理 解 : 说 到 Ruby 处 理 程序 ， 指 的 就 是 CRuby。 

男 一 方面 ，Rubinius 是 以 Evan Phoenix 为 中 心 开 发 的 Ruby 的 实现 之 一 。 

“用 Ruby 实现 Ruby” 是 Rubinius 的 象征 性 方针 。 

这 是 什么 意思 呢 ? 就 是 说 基本 的 核心 部 分 (VM 和 内 置 类 等 ) 用 C+t+ 来 写 ， 标准 库 等 外 部 
框架 部 分 则 全 用 Ruby 来 写 。 举 个 例子 ,在 Rubinius 中 String 类 的 绝 大 部 分 方法 都 是 用 Ruby 
写 的 。 









































330 第 12 章 Rubinius 的 垃圾 回收 





通过 把 尽 可 能 多 的 内 容 用 Ruby 来 写 ，VM 的 高 速 化 就 容易 和 Ruby 的 高 速 化 直接 联系 上 
了 。 正 是 因为 这 一 点 ，Rubinius 成 为 了 备 受 瞩目 的 Ruby 实现 之 一 。 不 过 VM 越 快 Ruby 也 就 
越 快 ， 反 过 来 VM 越 慢 Ruby 也 就 越 慢 。 也 就 是 说 ，VM 的 高 速 化 是 不 可 或 缺 的 。 从 这 一 点 
看 来 ， 想 必 Evan 对 于 VM 的 高 速 化 非常 有 自信 ， 才 采取 了 这 个 途径 。 

此 外 ， 除 了 Rubinius 以 外 ，Ruby 处 理 程 序 还 在 开发 其 他 实现 ， 如 下 所 示 。 























。JRuby (基于 Java 平 台 的 Ruby 实现 ) 
。IronRuby (基于 微软 .NET Framework 平 台 的 Ruby 实 现 ) 
。MacRuby( 基 于 Objective-C 平台 的 Ruby 实 现 ) 


@@ 


为 什么 要 讲 Rubinius 的 垃圾 回收 呢 ? 
事实 上 两 位 笔者 的 专业 都 是 CRupy 的 垃圾 回收 ,但 我 们 没有 选择 讲 CRuby， 而 是 选择 了 
Rubinius ， 其 原因 有 以 下 两 点 。 























1. Rubinius 的 垃圾 回收 采取 了 和 CRuby 的 垃圾 回收 不 同 的 途径 
2《Ruby 源 代码 完全 解读 》2 一 书 中 已 经 有 关于 CRuby 的 解说 了 

















关于 第 1 点 原因 ， 很 大 程度 上 是 出 于 笔者 个 人 的 兴趣 。 笔 者 所 进行 的 工作 主要 是 改良 CRuby 
的 垃圾 回收 ， 很 久之 前 就 对 Rubinius 的 垃圾 回收 感 兴趣 了 ， 所 以 就 想 借 本 书 来 解说 一 下 。 

第 2 点 指 的 是 青木 峰 郎 的 著作 《 Ruby 源 代码 完全 解读 》 9 一 书 ， 书 中 用 多 达 30 页 的 篇 幅 
细致 地 讲解 了 CRuby 的 垃圾 回收 ， 因 此 本 书 中 再 写 一 样 的 内 容 就 没有 意义 了 。 此 外 ， 非 常 感激 
RHG 在 Web 上 公开 了 此 书 的 全 文 2。 对 CRuby 的 垃圾 回收 有 兴趣 的 读者 可 以 查阅 其 中 的 第 5 章 。 












































12.1.2 ”获取 源 代码 


Rubinius 还 没有 发 布 的 版 本 “。 过 去 曾经 发 布 过 0.7 版 本 ,但 后 来 好 像 又 被 删除 了 。 
这 是 有 原因 的 。 原 本 Rubinius 的 核心 部 分 是 用 C 语言 写 的 ,但 是 因为 发 生 了 某 个 问 
题 "， 导 致 需要 大 幅度 更 改 VM， 所 以 干脆 就 把 Rubinius 移植 到 C++ 平台 了 ， 而 已 发 布 的 0.7 
版 本 差不多 就 在 那个 时 候 消失 了 。 
在 准备 编写 本 书 时 ， 如 何 解 说 源 代码 成 为 了 令 笔者 头疼 的 一 个 问题 ， 最 后 笔者 决定 以 执 























人 原 书 名 间 Ruby 一 又 二 一 下 完全 解说 ]， 目 前 尚 无 中 文 版 。 一 一 译 者 注 
@ 公开 网 站 : http://i.loveruby.net/ja/rhg/book/。 

(3) 2010 年 1 月 4 日 Rubinius 发 布 了 1.0.0RC2 版 本 。 

@ 如 果 想 了 解 这 个 问题 ， 请 查询 以 下 网 址 : http://betterruby.wordpress.com/2008/04/11/shotgun-rewrite-underway/。 





笔 时 ( 即 2009 年 8 月 17 日 ) 的 源 代 码 为 对 象 来 解说 。 这 是 因为 对 于 以 后 垃圾 回收 的 基本 部 
分 而 言 ， 源 代码 不 会 有 太 大 改动 。 

除 此 之 外 , 笔者 还 担心 从 C 语言 到 C++ 的 移植 过 程 是 否 已 经 结束 了 。 不 过 经 调查 ， 
Rubinius 已 经 全 部 移植 到 了 C++。 

那么 接 下 来 就 来 获取 Rubinius 的 源 代码 吧 。Rubinius 的 源 代码 在 github® 里 。 

https://github.com/rubinius/rubinius 

只 需 把 以 下 命令 输入 到 命令 提示 符 里 (需要 git)， 就 可 以 获取 源 代码 。 

















$ git clone git://github.com/rubinius/rubinius.git 
之 后 来 检查 本 章 中 要 解说 的 码 树 吧 。 


$ cd rubinius 


$ git checkout 5af42280ab956 


Rubinius 的 官网 网 址 如 下 ， 这 里 汇集 了 所 有 关于 Rubinius 的 信息 的 链接 。 


http://rubinius.com/ 


Home | Roadmap | Benchmarks | Community | Contribute | Documen 


Rubinius 





vy Download with git 


What is Rubinius? 
Rubinius is an implementation of the Ruby programming language. 


The Rubinius bytecode virtual machine is written in C++, The bytecode compiler is written in pure Ruby. The vast majorily of the core library is also 
written in Ruby, with some supporting primitives that interact with the VM directly. 


Rubinius uses a precise, generational garbage collector Rubinius provides a foreign function interface (FFI) and a compatible C-APl for C/C++ 
extensions written for the standard Ruby interpreter (often referred to as MRI 一 Matzs Ruby Implementation). 


Get Started exploring Rubinius by downloading the source and building it. 





图 12.1 Rubinius 官 方 网 站 





@ github: git 仓 库 的 免费 项 目 托 管 服务 。 
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12.1.3 ” 源 代码 结构 


Rubinius 总 共 由 约 62 万 行 的 源 代码 构成 ， 大 体内 容 如 下 所 示 。 


表 12.1 源 代码 的 分 布 
源 代码 行 数 
317 560 


166 499 
54 505 





























库 的 描述 中 也 用 到 了 Ruby， 所 以 Ruby 的 源 代码 理所当然 地 占 去 了 大 半 比 例 。 令 人 感到 
意外 的 是 ，C 语言 占 比例 也 很 高 ， 这 是 因为 外 部 的 C 库 也 跟 源 代码 捆绑 在 一 起 了 。 
下 面 一 起 来 看 看 目录 的 结构 。 





表 12.2 目录 结构 


benchmark 基准 测试 文件 群 
bin rbx 等 执行 文件 群 

有 关 Rubinius 的 文档 

Object、Kernel 类 等 内 置 类 的 定义 文件 (用 的 都 是 Ruby ) 

标准 库 

mspec Ruby 制 作 的 测试 框架 rspec 的 克隆 实现 

rakelib Rake 库 

runtime 编译 字 节 码 后 的 Ruby 文 件 群 

spec 


















































RubySpec 的 Ruby 规 格 测试 
stdlib 标准 库 

test Rubinius 的 测试 

tools 工具 群 
vm 


VM 源 代码 


























本 章 中 主要 的 代码 群 都 在 vm 目录 下 。 关 于 其 他 目录 我 们 只 简单 介绍 一 下 ， 不 会 详 述 。 
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12.2 


Rubinius 的 垃圾 回收 采用 的 是 第 7 章 中 出 现 过 的 分 代 垃 圾 回收 ， 分 代 垃 圾 回收 的 结构 请 
参考 表 12.3。 





表 12.3 分 代 垃 圾 回收 的 结构 


新 生 代 GC GC 复制 算法 (Cheney 的 GC 复制 算法 ) 





老年 代 GC GC 标 记 - 清 除 算法 、ImmixGC( GC 标记 -压缩 算法 ) 














在 老年 代 GC 方面 采用 的 是 GC 标记 - 清除 算法 和 第 5 章 中 讲 过 的 InamixGC(GC 标记 - 
压缩 算法 )。 关 于 GC 标记 - 压缩 算法 的 实现 我 们 在 第 10 章 中 已 经 讲 过 了 。 

在 新 生 代 GC 方面 采用 的 则 是 第 4 章 中 讲 过 的 GC 复制 算法 。 在 本 章 中 我 们 会 对 GC 复 
制 算 法 的 实现 加 以 解说 。 

此 外 ，Rubinius 的 GC 是 准确 式 GCC。 在 本 书 中 ,本章 是 第 一 次 介绍 准确 式 GC 的 实现 ， 
此 我 们 会 细致 地 讲解 这 部 分 内 容 。 


@@ 


GC 和 语言 处 理 程序 

GC 是 为 语言 处 理 程序 而 生 的 技术 ， 大 多 数 GC 都 是 为 了 搭载 语言 处 理 程序 而 被 创造 出 来 的 。 
日 是 不 光 语 言 处 理 程序 能 利用 GC ， 各 种 各 样 的 应 用 程序 也 可 以 利用 GC 。 
有 一 个 著名 的 GC 库 , 叫 作 The Boehm-Demers-Weiser conservative garbage 
collector@ 。 很 多 应 用 程序 中 都 利用 了 这 个 库 ， 下 面 是 几 个 具有 代表 性 的 例子 。 



















































































。w3m 9 一 一 文字 界面 的 网 页 浏览 器 
。|rssi2 一 一 CU| 界 面 的 IRC 客户 端 


因为 这 个 GC 库 是 Boehm 主导 开发 的 ， 所 以 简称 为 BoehmGcC 。 











人 BoehmGC : http:/www.hboehm.info/gc/。 

@ 库 名 中 的 Weiser 作 为 “ 普 适 计算 之 父 ” 而 著名 。 
@ w3m: http://w3m.sourceforge.net/index.ja.html。 
@ Irssi: http:Wirssi.org/。 
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下 素 通 对 象 管理 


按照 本 书 的 老 规矩 ， 我 们 先 从 数据 结构 开始 看 。 


12.3.1 ”对 象 的 结构 


在 Rubinius 中 ，Ruby 的 大 部 分 内 置 类 (object 、Numeric 等 ) 都 是 作为 C++ 的 类 实现 的 。 
大 致 的 类 图 如 下 所 示 。 














ObjectHeader 


Object 











I 0 
[ces | [ Pom | [Lee | … 


图 12.2 类 图 














有 一 点 请 大 家 注意 : 所 有 的 类 都 继承 了 Object 类 ,并且 Object 类 继承 了 ObjectHeadero 
那么 这 个 objectHeader 类 里 又 存 着 怎样 的 信息 呢 ? 


vm/oop.hpp 
133 class ObjectHeader { 
134 union { 
135 struct { 
136 object_type obj_type_ : 8; 
7 gc_Zzone Zone : ss 
138 unsigned int age : 4; 
139 
140 unsigned int Forwarded : 4 
141 unsigned int Remember : 法 
142 unsigned int Marked : 2: 
143 unsigned int RequiresCleanup : 二 
144 
145 unsigned int RefsAreWeak : 
146 
147 unsigned int InImmix : 4 
148 unsigned int Pinned : 和 
149 后 
150 uintptr_t all_flags; // 以 指针 的 大 小 对 齐 
151 二 
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这 个 类 里 用 的 是 位 域 。 在 这 里 定义 第 136 行 的 obj_type_ 为 8 位 , 第 137 行 的 zone 为 2 位 。 















































8 位 6bj typee 对 象 的 类 别 DD 
i 所 属 空间 ( 新 生 代 空 间或 老年 代 空间 ) 
人 年 龄 (从 新 生 代 CC 中 存活 下 来 的 次 数 ) 
1 位 Forwarded forwarding …… 是 否 为 forwarding 指针 
”Remember ee 是 否 已 被 记录 在 remembered_set 中 
2 位 ”Marked eee 用 于 GC 的 标记 
1 位 ”RequiresCleanup …………… 释放 对 象 时 是 否 调用 cleanup(0 
”RefsAreWeak ……… 是 否 为 弱 引用 对 旬 
-Timm 是 否 为 ImmixGC 的 对 象 
” Pinned wee 不 能 用 ImmixGC 移动 





























all_ flags 


图 12.3 ObjectHeader 的 标记 结构 





但 是 这 些 标 记 很 少 直接 出 现在 源 代 码 里 。 因 为 在 0bjectHeader 类 里 定义 了 获取 和 操作 
标记 信息 的 成 员 函 数 ， 所 以 这 里 就 通过 它们 来 访问 标记 。 


12.3.2 _ 用 于 GC 复制 算法 的 内 存 空间 
首先 来 简单 说 明 一 下 Rubinius 的 VM Heap 的 整体 结构 吧 。 




















VM Heap 





用 于 GC 标记 -清除 算法 的 内 存 空间 

















于 ImmixGC 的 内 存 空间 


T 
zz 


























用 于 GC 复制 算法 的 内 存 空间 


From 空间 To 空间 





























12.4 ”Rubinius 的 VM Heap 的 结构 


这 里 将 作为 GC 标记 - 清除 算法 的 对 象 的 内 存 空 间 称 为 “用 于 GC 标记 - 清除 算法 的 内 
存 空间 ”， 同 样 还 有 “用 于 ImmixGC 的 内 存 空 间 ”“ 用 于 GC 复制 算法 的 内 存 空 间 ”。 我 们 把 “用 
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于 GC 复制 算法 的 内 存 空 间 ” 平均 分 成 了 两 份 ， 分 别称 为 “From 空间 ”和 “To 空间 ”。 现 在 正 
在 使 用 的 内 存 空间 是 From 空间， 就 像 在 第 4 章 中 讲 过 的 那样 ， 每 次 执行 GC 都 要 将 From 空 
间 和 To 空间 进行 替换 。 

在 Rubinius 中 ， 这 个 用 于 GC 复制 算法 的 内 存 空间 则 被 作为 Heap 类 来 实现 。Heap 类 的 
成 员 变 量 的 定义 如 下 所 示 。 














vm/gc/heap.hpp 





6 typedef void *address; 
10 class Heap { 

sh /* Fields */ 

12 

13 public: 

14 address start; 

15 address current; 

16 address last; 

17 address scan; 








成 员 变量 的 型 address 是 void* 的 别名 。 start 是 用 于 GC 复制 算法 的 内 存 空间 的 初始 
地 址 ，last 是 结束 地 址 。current 是 分 块 的 初始 地 址 ，scan 指 的 是 下 一 个 要 查找 的 内 存 空 间 
的 地 址 。 至 于 scan， 只 有 在 执行 GC 的 时 候 才 会 用 到 。 



































From 空间 


| | | 


start current last 


scan ( 执行 GC 时 使 用 ) 














图 12.5 用 于 GC 复制 算法 的 内 存 空间 的 结构 

















GC 复制 算法 的 内 存 空间 是 单纯 用 std: :calloc() 函数 统一 分 配 的 。 下 面 一 起 来 看 看 
Heap 类 的 构造 函数 吧 。 
vm/gc/heap.cpp 


6 /* Heap methods */ 
7 Heap: :Heap(size_t bytes) { 


8 size = bytes; 

9 start = (address)std::calloc(1, size); 

10 scan = start; 

11 last = (void*)((uintptr_t)start + bytes - 1); 





hb reset() ; 
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13 } 

14 

19 void Heap::reset() { 
20 current = start; 
21 scan = start; 

22 二 





这 里 只 是 单纯 以 bytes 作为 参数 调用 std: :calloc() 函数 ， 并 对 Heap 类 的 成 员 变 量 执行 
初始 化 。 


12.3.3 ”对 象 的 分 配器 


在 分 配对 象 时 ， 要 根据 所 申请 的 大 小 和 GC 的 情况 ， 从 之 前 讲 过 的 那 3 个 内 存 空 间 中 选 
出 1 个 进行 分 配 。 
图 12.6 是 简单 的 流程 图 。 



























对 象 大 小 是 否 超过 阔 值 ? 





















是 否 能 分 配 到 用 于 GC 
复制 算法 的 内 存 空间 ? 








分 配 到 用 于 ImmixGC 的 
内 存 空间 





图 12.6 选择 分 配 





在 Rubinius 里 ， 这 些 GC 也 是 分 别 由 与 其 对 应 的 类 来 管理 的 。 
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表 12.4 内 的 类 实现 了 各 个 GC 所 需要 的 全 部 操作 ， 在 各 个 类 内 也 实现 了 分 配 融 。 
表 12.4 GC 与 类 的 对 应 关系 





GC 复制 算法 BakerGC 





ImmixGC ImmixGC 
GC 标记 -清除 算法 MarkSweepGC 

















然后 统一 这 些 GC 类 的 就 是 bbjectMemory 类 。0bjectMemory 类 就 像 是 各 个 GC 类 的 窗口 。 
在 Rubinius 中 执行 有 关 GC 的 操作 时 ， 不 是 直接 使 用 GC 类， 而 是 使 用 这 个 objectMemory 类 。 
对 象 的 分 配 也 是 通过 0bjectMemory 类 来 执行 的 。 
通过 图 12.7 这 样 的 设计 ，mnutator 就 没有 必要 去 在 意 GC 类 的 差别 了 。 反 过 来 窗口 的 
ObjectMemory 类 会 选 一 个 适当 的 GC 类 ， 从 其 分 配 需 进行 分 配 。 


申请 分 配 内 存 
[|| ObjectMemory Ss BakerGC 
返回 内 存 Se 
( mutator 不 用 在 意 GC 类 的 差别 ) 
ImmixGC 
选择 哪 一 个 


图 12.7 调用 分 配器 






























































可 以 看 出 这 个 设计 的 意图 在 于 隐藏 GC 类， 从 而 能 够 简单 地 更 改 和 追加 GC 算法 。 
事实 上 ImmixGC 类 是 近来 才 追 加 的 , 在 修正 GC 类 以 外 的 代码 时 ， 只 要 稍微 重 写 一 下 
ObjectMemory 类 就 可 以 了 。 

实际 的 分 配 工作 是 由 0bjectMemory 类 的 成 员 隐 数 allocate_object() 负责 的 。 隐 数 的 内 
容 如 下 所 示 。 








vm/objectmemory.cpp 
227 Object* ObjectMemory::allocate_object(size_t bytes) { 


228 Object* obj ; 
229 
230 if(unlikely(bytes > Large_object_threshold)) { 


231 obj = mark_sweep_.allocate(bytes, &collect_mature_now); 
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} else { 
obj = young.allocate(bytes, &collect_young_now); 
if(unlikely(obj == NULL)) { 


obj = immix_.allocate(bytes); 


/* 对 象 内 域 的 初始 化 */ 
obj->clear_fields(bytes); 
return obj; 


3 


allocate_object() 将 mutator 申请 的 大 小 (bytes ) 作为 参数 。 

第 230 行 用 于 将 阔 值 large_object_threshold 和 bytes 进行 比较 。 阔 值 large_object_ 
threshold 的 默认 值 是 2700( 字 节 ) 我们 可 以 通过 启动 选项 -Xgc.1Large_object 来 更 改 这 个 值 。 

当 bytes 超过 了 large_object_threshold 时 ， 就 调用 成 员 变量 mark_sweep_ 的 allocate()。 
mark_sweep_ 是 MarkSweepGC 类 的 实例 。 

当 bytes 不 超过 large_object_threshold 时 ， 就 调用 成 员 变 量 young 的 allocate()。 young 









































是 BakerGC 类 的 实例 o 


当 使 用 BakerGc 分 配 失 败 时 ， 就 需要 在 第 246 行 调 用 ImmixGc 类 的 实例 ， 即 immix_ 的 
allocate() 。 

如 图 12.6 所 示 ， 可 知 操作 已 经 被 分 配给 了 各 个 GC 类 的 分 配 右 。 

话说 回来 ， 代 码 中 的 宏 unlikely() 又 是 干什么 用 的 呢 ? 





vm/util/optimize.hpp 





#ifdef __GNUC__ 


#define likely(x) __builtin_expect((long int)(x) ,1) 
#define unlikely (x) __builtin_expect((long int) (x),0) 
#else 


#define likely(x) x 
#define unlikely(x) x 


#endif 

















第 7 行 到 第 8 行 的 _builtin_expect() 是 个 内 置 函数 ， 它 负责 给 编译 器 提示 分 文 预测 。 
_builtin_expect() 不 是 C++ 的 标准 函数 ， 而 是 gcc 的 扩展 功能 。 以 unlikely() 为 例 ， 它 就 
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会 提示 编译 器 “传递 给 参数 的 条 件 结果 几乎 全 为 假 "。 这 样 一 来 ,我 们 就 能 令 编 译 器 最 优化 ， 
使 其 在 条 件 为 “ 假 ” 时 高 速 运作 。 
今后 如 果 大 家 在 源 代 码 中 看 到 使 用 了 宏 unlikely() 的 地 方 ， 就 可 以 认为 “这 里 几乎 全 为 


假 ”"。 反 








过 来 likely() 就 是 几乎 全 为 真 。 


12.3.4 ”GC 复制 算法 的 分 配器 
本 章 中 将 介绍 GC 复制 算法 (BakerGc 类 ) 的 分 配器 。 因 为 其 他 分 配器 没有 说 明 GC 本 身 ， 
所 以 就 不 再 歼 述 了 。 
请 大 家 看 一 下 BakerGc 类 的 构造 函数 。 





vm/gc/baker.cpp 
19 BakerGC: :BakerGC(0bjectMemory *om, size_t bytes) : 
20 GarbageCollector (om) ， 
21 heap_a(bytes) ， 
22 heap_b(bytes) ， 
23 total_objects(0) ， 
24 Promoted_(0) 
25 { 
26 current = &heap_a; 
27 next = &heap_b; 
28 3 








这 里 需要 大 家 注意 的 是 第 21 行 和 第 22 行 的 成 员 变 量 heap_a 和 heap_b 的 初始 化 。 可 见 
构造 函数 的 参数 bytes 直接 被 传递 了 出 去 。 
这 个 成 员 变量 的 型 是 Heap 类 ， 负 责 管理 用 于 GC 复制 算法 的 内 存 空间 。 











vm/gc/baker.hpp 
25 class BakerGC : public GarbageCollector { 
26 public: 
27 
28 /* Fields */ 
29 Heap heap_a; 
30 Heap heap_b; 
31 Heap *current; 
32 Heap *next; 
33 size_t lifetime; 
34 size_t total_objects; 








在 GC 复制 算法 中 ,需要 两 个 内 存 空间 ， 这 两 个 内 存 空间 就 是 heap_a 和 heap_b。 这 里 
将 执行 分 配 的 内 存 空间 (From 空间 ) 的 地 址 分 配给 current， 在 GC 的 时 候 把 作为 对 象 目标 空 
间 的 内 存 空间 (To 空间 ) 的 地 址 分 配给 next。 
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BakerGC 


Heap *current 一 heap a (From 空间 ) 


Heap *next 一 一 ~| heap b (To 空间 ) 





将 current 所 指 的 空间 设 为 From 空间 ， 将 next 所 指 的 空间 设 为 To 空间 


12.8 ”BakerGC 类 结构 

















下 面 来 看 看 BakerGc 类 的 成 员 函 数 allocate() 吧 。 首 先是 它 的 前 半 部 分 。 


vm/gc/baker.hpp:BakerGC.allocate(): 前 半 部 分 


37 
38 


45 


60 
61 
62 
63 
64 


77 





Object* allocate(size_t bytes, bool *collect_now) { 


Object* obj; 


if(!current->enough_space_p(bytes)) { 


return NULL; 


} else { 


total_objects++; /* 正在 分 配 的 对 象 总 数 */ 


obj = (0bject*)current->allocate(bytes); 





后 半 部 分 */ 





第 45 行 的 enough_space_p() 函数 负责 调查 所 申请 大 小 (bytes ) 的 分 块 在 不 在 用 于 GC 复 
制 算法 的 内 存 空间 (Heap) 里 。 
如 果 还 有 空闲 空间 ， 就 在 第 63 行 调用 Heap 类 的 成 员 函 数 allocate() ， 执 行 分 配 。 


vm/gc/heap.hpp:Heap.allocate() 


23 
24 
25 
26 
27 
28 
29 





address allocate(size_t size) { 


address addr ; 
addr = current; 


current = (address)((uintptr_t)current + size); 


return addr; 
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最 后 将 Heap 类 的 成 员 变量 current 设 定 给 addr， 把 current 偏 移 size 大 小 (分 配 的 大 
小 )， 之 后 只 要 返回 addr 就 行 了 。 


Heap (From 空间 ) 


使 用 空间 未 使 用 空间 


| 


addrcurrent 




















使 用 空间 分 配 size 大 小 未 使 用 空间 








| | 


addr current 


12.9 分 配 Heap 类 


接 下 来 是 后 半 部 分 。 
vm/gc/baker.hpp:BakerGC.allocate(): 后 半 部 分 
37 Dbject* allocate(size_t bytes, bool *collect_now) { 
38 Object* obj; 


/* 前 半 部 分 */ 





70 obj->init_header (Young0bjectZone, InvalidType); 
76 return obj; 
7 了 


如 果 函 数 成 功 地 从 Heap 类 返回 了 所 分 配 的 内 存 空间 的 地 址 ， 就 初始 化 这 个 对 象 内 的 
ObjectHeader 的 标记 。 关 于 这 项 操作 请 看 第 70 行 。 


vm/oop.hpp:ObjectHeader.init_header() 


193 void init_header(gc_zone loc, object_type type) { 
194 all_flags = 0; 

195 obj_type_ = type; 

196 Zone = loc; 


197 了 
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在 第 194 行 用 0 将 all_flags 初始 化 ,之 后 设 定 obj_type-( 对 象 的 类 别 ID)。 这 次 只 
执行 分 配 , 所 以 要 设 定 InvalidType( 无 效 型 )。 然 后 在 第 196 行将 zone( 所 属 世 代 ) 设 置 成 
Young0bjectZone (新 生 代 )。 


此 污浊 走向 准确 式 6C 之 路 


Rubinius 的 GC 是 准确 式 GC。 这 一 市 中 我 们 会 为 大 家 介绍 几 点 执行 准确 式 GC 所 需 的 准 
备 工作 。 




















12.4.1 根 
Rubinius 的 根 由 以 下 内 容 构成 。 


1. 内 置 类 、 模 块 、 符 号 

2. VM 的 调用 栈 

3. GC 正在 保护 的 对 象 

4. 用 于 C 语言 扩展 库 的 处 理 器 (handler) 


请 看 第 1 项 。Rubinius 中 把 Ruby 里 的 String 和 Array 等 内 置 类 以 及 内 置 模块 等 都 作为 
对 象 分 配 到 了 VM Heap， 因 此 它们 也 成 了 GC 的 对 象 ， 必须 归 到 根 里 。 

第 2 项 是 VM 的 调用 栈 中 的 对 象 。 对 调用 栈 而 言 ， 基 本 上 每 次 调用 方法 时 都 会 堆积 一 个 
调用 帧 ， 当 方法 的 操作 结束 时 (return 时 ) 都 会 邹 下 一 个 调用 帧 。 这 部 分 内 容 已 经 在 第 10 章 
中 讲 过 了 ， 所 以 这 里 就 不 详细 说 了 。 

第 3 项 是 GC 正在 保护 的 对 象 。 为 了 不 释放 GC 正在 保护 的 对 象 ， 它 也 被 当成 了 根 的 一 
部 分 。 

接 下 来 是 第 4 项 。 这 个 “用 于 C 语言 扩展 库 的 处 理 器 ” 指 的 是 什么 呢 ? 本 章 中 会 以 这 个 
疑问 为 主题 ， 在 之 后 的 内 容 里 进行 详细 说 明 。 


12.4.2 ”CRuby 是 保守 式 GC 
CRuby 的 GC 是 保守 式 GC， 关 于 其 原因 ， 作 者 松本 行 弘 在 自己 的 日 记 卫 里 这 样 写 道 。 



























































exact 的 (精确 的 )GC 从 性 能 上 来 说 较 有 利 ， 但 另 一 方面 ， 保 守 式 GC 扩展 库 写 起 来 更 容易 。 

















《中略 ) 

















因为 CRuby 重视 的 是 开发 效率 ， 所 以 今后 应 该 也 会 继续 使 用 保守 式 GC 。 














GD Matz 日 记 : http:/www.rubyist.net/~matz/20080623.html。 
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就 像 大 家 从 这 篇 日 记 中 看 到 的 那样 ，CRuby 采用 保守 式 GC， 其 最 大 原因 在 于 “扩展 库 
写 起 来 更 容易 ”。 
那么 这 个 扩展 库 指 的 是 什么 呢 ? 还 有 ， 为 什么 保守 式 GC 扩展 库 写 起 来 更 容易 呢 ? 


12.4.3 CRuby 的 C 语 言 扩展 库 
扩展 库 严 格 来 说 指 的 是 “C 语言 扩展 库 ”。CRuby 向 用 户 提 供 了 “C 语言 扩展 库 ” 这 种 构造 。 
通过 C 语言 扩展 库 ， 用 户 能 够 轻松 地 用 C 语言 扩展 CRuby 自身 。 简 单 来 说 ， 大 家 可 以 认为 
C 语言 扩展 库 是 “用 C 语言 写 的 Ruby 库 ”。 
写 C 语言 扩 展 库 的 主要 动机 如 下 。 







































































1. 实现 重视 速度 的 操作 
2. 利用 能 用 C 语言 使 用 的 库 群 





下 面 让 我 们 来 看 看 这 个 CRuby 的 C 语言 扩展 库 的 示例 代码 ， 找 一 找 感觉 吧 。 这 次 就 用 
C 语言 扩展 库 的 形式 来 写 一 下 经 典 的 Hello World 程序 。 








代码 清单 12.1: hello_world.c 


#include "ruby.h" 


VALUE hello_world(VALUE self) 


不 
VALUE str; 
str = rb_str_new2("Hello World\n'"); 
rb_io_write(rb_stdout, str); 
return Qnil;, 
了 


void Init_hello_world() 
二 

rb_define_method(rb_mKerne1l，'"hello_world" ，hello_world，0) ; 
上 上 





hello_world() 困 数 是 将 "Hello World" 字符 串 输 出 到 标准 输出 的 函数 。 我 们 来 简单 说 
明 一 下 这 个 函数 的 内 容 吧 。VALUE 这 个 型 简单 来 说 就 是 指向 对 象 的 指针 型 。rb_str_new2() 
函数 负责 由 C 语言 的 字符 串 生 成 Ruby 的 字符 串 对 象 。 指 向 生成 的 字符 串 对 象 的 指针 保存 在 
str 变量 里 ， 然 后 我 们 用 rb_io_write() 函数 输出 Ruby 的 字符 串 对 象 。 

首先 用 rb_define_method() 国 数 把 C 语言 的 函数 定义 成 Ruby 中 的 类 。 这 样 一 来 我 们 就 
将 hello_world 函数 定义 成 了 Kernel 类 (rb_mKernel )s 
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带 有 rb_ 这 个 前 缀 的 函数 和 变量 是 Ruby 已 经 对 外 公开 的 接口 。 带 有 rb_ 的 函数 群 (或 变 
量 群 ) 被 定义 在 ruby.h 中 ， 我 们 可 以 从 C 语言 扩展 库 中 调用 它们 。 
编译 并 加 载 这 段 源 代 码 后 ， 其 运行 情况 如 下 所 示 。 

















require 'hello_world' # 读 取 扩展 库 


hello_world() 
#=> Hello World 





最 后 我 们 成 功 地 在 扩展 库 中 完成 了 Hello World。 

请 大 家 重新 好 好 看 一 下 代码 清单 12.1。 虽 然 我 们 在 hello_world() 虹 数 内 调用 rb_str_ 
new2() ， 生 成 了 传递 给 Ruby 的 API 的 字符 串 , 但 是 大 家 或 许 已 经 注意 到 了 ， 代 码 清单 1 中 
没有 任何 关于 GC 的 描述 (例如 打上 标记 、 清 除 标 记 等 )。 

在 第 6 章 中 也 提 到 过 ,保守 式 GC 是 以 CPU 的 寄存 器 和 C 语言 的 调用 栈 为 根 的 。 我 们 
即使 不 明确 地 设 定 根 ，GC 也 会 擅自 将 寄存 器 和 栈 中 的 对 象 看 作 活动 对 象 。 因 此 我 们 可 以 不 
用 去 在 意 CC， 单纯 写 C 语言 扩展 库 就 行 。 

CPython 和 CRuby 一 样 配备 了 C 语 言 扩 展 库 这 种 构造 , 不 过 运行 起 来 没 这 么 简单 。 
CPython 的 GC 因为 采用 的 是 引用 计数 法 ， 所 以 需要 执行 计数 器 的 增 减 操作 。 如 果 我 们 要 用 
CPython 实现 跟 这 段 示 例 代码 一 样 的 效果 ， 就 需要 在 hello_world() 也 数 的 最 后 对 str 变量 
指向 的 对 象 的 计数 器 执行 减 量 操作 。 

到 了 这 一 步 大 家 可 能 还 有 些 迷 茫 ， 不 过 大 家 可 以 考虑 一 下 要 是 换 成 准确 式 GC 该 怎么 实 
现 C 扩展 库 ， 这 样 就 能 慢 慢 理解 保守 式 GC 给 我 们 带 来 的 好 处 了 。 


12.4.4 。 C 语 言 扩展 库 (准确 式 GC 篇 ) 


实际 上 前 一 节 中 生成 的 C 语言 扩展 库 的 示例 代码 也 能 在 Rubinius 中 正常 运作 。 这 是 
为 Rubinius 支持 用 于 CRuby 的 C 扩展 库 。 

在 这 里 有 一 个 问题 ，Rubinius 的 GC 是 准确 式 GC。 当 GC 是 准确 式 GC 时 ， 该 如 何 实现 
C 语言 扩展 库 呢 ? 

换 句 话说， 就 是 要 如 何 处 理 指 向 Ruby 处 理 程序 传递 的 对 象 的 指针 。 举 个 例子 ， 在 代码 
清单 12.1 中 ，rb_str_new2() 函数 给 出 了 指向 字符 串 对 象 的 指针 ， 那 么 要 怎么 管理 这 个 指针 
呢 ? 

拿 保 守 式 GC 来 说 ， 因 为 Ruby 处 理 程序 的 GC 是 保守 式 GC， 所 以 即使 指向 对 象 的 指针 
从 C 语 言 扩 展 库 的 调用 栈 (寄存 器 ) 游 出， 它们 也 会 被 正确 地 视 为 活动 对 象 。 









































| 
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保守 式 GC 的 管理 范围 




















C 语言 扩展 库 








Ruby 处 理 程序 





对 象 指针 





因为 在 范围 内 ， 所 以 能 发 现 指针 ! 














图 12.10 C 语 言 扩展 库 中 的 对 象 指针 (保守 式 GC 的 情况 下 ) 

















然而 换 成 准确 式 GC 就 不 是 这 样 了 。 准 确 式 GC 中 不 能 搜索 C 语言 的 调用 栈 和 寄存 央 ， 
所 以 也 发 现 不 了 C 语言 扩展 库 里 洪 出 的 那些 指向 对 象 的 指针 。 

为 了 简要 说 明 ， 图 12.11 中 只 画 出 了 函数 的 返回 值 。 不 过 不 仅 限 于 返回 值 ， 从 Ruby 处 
理 程序 调用 C 语言 扩展 库 的 函数 时 传递 的 参数 (指向 对 象 的 指针 ) 也 有 同样 的 问题 。 





























准确 式 GC 的 管理 范围 :五 二 各 
调用 函数 C 语 言 扩展 库 









































找 不 到 指针 ! 


图 12.11 C 语 言 扩展 库 中 的 对 象 指针 ( 准确 式 GC 的 情况 下 ) 























因此 ， 在 准确 式 GC 环境 下 ， 为 了 实现 C 语言 扩展 库 ， 如 何 通过 Rubinius 管理 C 语言 扩 
展 库 中 游 出 的 对 象 指 针 就 变 得 至 关 重 要 。 

12.4.5 ”Rubinius 的 解决 方法 

Rubinius 把 指向 传递 给 C 语言 扩展 库 的 所 有 对 象 的 指针 存 入 处 理 器 ， 这 就 是 12.4.1 节 中 
所 说 的 “用 于 C 语言 扩展 库 的 处 理 需 ”。 


在 图 12.12 这 样 的 情况 下 ， 就 能 用 准确 式 GC 来 管理 指向 传递 给 C 语言 扩展 库 的 对 象 的 
旨 针 了 了。 这样 一 来 就 能 判断 传递 给 C 语言 扩展 库 的 对 象 是 活动 对 象 还 是 非 活动 对 象 了 。 
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准确 式 GC 的 管理 范围 
































Ruby 处 理 程序 . C 语 言 
(准确 式 GC ) 区 调用 也 数 
处 理 顺 列表 
存储 下 来 对 象 指 针 
| 19 

















因为 在 范围 内 ， 所 以 可 以 














用 准确 式 GC 管理 ! 

















12.12 ”用 于 传递 的 处 理 器 


12.4.6 Hello Hello World 
为 了 让 大 家 详细 了 解 Rubinius 是 怎么 管理 处 理 咒 的 ， 这 里 我 们 准备 了 新 的 示例 代码 。 


代码 清单 12.2: hello_hello_world.c 


#include "ruby.h" 








VALUE hello_world(VALUE self, VALUE str) 


‘ 
VALUE str2; 
str2 = rb_str_new2("Hello WorldNn'" ) ; 
rb_io_write(rb_stdout, str); 
rb_io_write(rb_stdout, str2); 
return Qnil; 

= 


VALUE hello_hello_world(VALUE self) 
{ 

VALUE str; 

str = rb_str_new2("Hello "); 








/* 将 变量 str 作 为 参数 调用 hello_wor1ld() 函数 */ 


rb_funcall(rb_mKernel, rb_intern("hello_world"), 1, str); 








return Qnil; 
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void Init_hello_hello_world() 


{ 
/* 给 Ruby 定 义 C 语 言 函 数 */ 
rb_define_method(rb_mKernel, "hello_world", hello_world, 1); 
rb_define_method(rb_mKernel, "hello_hello_world", hello_hello_world, 0); 
了 


代码 清单 12.2 和 代码 清单 12.1 的 不 同 之 处 在 于 ， 代 码 清 单 12.2 中 hello_worldq() 国 数 
取 了 参数 ， 以 及 新 追加 了 hello_hello_world() 函数 。 至 于 代码 中 的 rb_funcal1() 函数 ， 从 
函数 名 就 可 以 看 出 它 负 责 执 行 函数 (方法 ) 的 调用 。 这 种 情况 就 意味 着 要 把 str 作为 参数 ， 
调用 属于 kernel 类 的 hello_wor1ld() 方法 。 此 外 , 第 3 个 参数 “1” 表 示 的 是 传递 给 用 rb_ 
funcall1() 调用 的 方法 的 参数 数量 。 
那么 来 执行 看 看 吧 。 




















require 'hello_hello_world' 


hello_hello_world() 
#=> Hello Hello World 

















后 输出 了 Hello Hello World。 其 中 最 前 面 的 Hello 是 用 hello_hello_wor1d() 函数 生 


成 的 。 


12.4.7 ”Rubinius 的 处 理 器 管理 


Rubinius 中 以 类 似 引用 计数 法 的 形式 来 管理 处 理 器 的 生死 。 建 议 大 家 结合 代码 清单 12.2 
的 处 理 流程 来 理解 Rubinius 的 处 理 需 管理 。 代 码 清单 12.2 的 内 部 处 理 流 程 如 下 所 示 。 








.调用 hello_hello_world() 
.调用 C 语言 扩展 库 的 hello_hello_world() 函数 
.生成 字符 串 对 象 
.调用 hello_world() 函数 
. 生成 字符 串 对 象 
结束 hello_world() 函数 
结束 hello_hello_world() 函数 





下 面 让 我 们 来 依次 看 一 下 。 首 先是 从 Ruby 层 调用 了 hello_hello_vorld() 方法 。 
图 12.13 所 示 为 调用 hello_hello_world() 函数 时 Rubinius 的 处 理 需 的 状态 。 一 开始 我 
们 就 为 Rubinius 准备 了 全 局 处 理 需 列 表 ， 这 个 列表 中 存 有 指向 处 理 器 的 指针 。 
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| hello_hello world() 


Rubinius 


全 局 处 理 需 列表 








12.13 (1) 调用 hello_hello_world() 





接 下 来 Rubinius 将 调用 C 语言 扩展 库 的 hello_hello_world() 函数 ， 这 一 步 操作 如 图 
12.14 所 示 。 


| hello_hello_world() 
hello_hello world() 








Rubinius >| C 语 言 扩展 上 





帧 处 理 需 表格 








NativeMethodFrame 


全 局 处 理 需 列表 











图 12.14 (2) 调 用 C 语 言 扩展 库 的 hello_hello_world() 函数 


在 调用 hello_hello_world() 图 数 之 前 ， 要 确保 NativeMethodFrame 在 本 地 的 (C++ 的 ) 
调用 栈 中 。 其 内 部 有 帧 专用 的 处 理 融 表格 ( 散 列 表 )。 帧 处 理 絮 表格 里 保存 着 指向 对 象 的 处 理 
恬 的 指针 ， 这 些 指 针 是 在 所 调用 的 C 语言 扩展 库 函 数 内 使 用 的 。 

在 hello_hello_world() 国 数 内 部 调用 Rubinius 的 rb_str_new2() 图 数 ， 和 后 成 字符 串 对 
象 。 我 们 将 其 称 为 对 象 A。 因 为 还 没有 生成 过 用 于 对 象 A 的 处 理 咒 ， 所 以 需要 生成 一 个 新 的 
处 理 需 ， 此 时 的 状态 如 图 12.15 所 示 。 

接 下 来 把 生成 的 处 理 需 的 指针 追加 到 帧 处 理 需 表格 和 全 局 处 理 器 列表 里 ， 再 把 指向 处 理 
髓 的 指针 也 存 信 对象 A 内 的 实例 变量 capi_handle 中 。 

在 处 理 咒 内 有 “计数 咒 ”， 它 表示 的 是 这 个 对 象 的 处 理 需 被 NativeMethodFrame 内 的 帧 处 
理 器 表格 引用 了 多 少 次 (在 图 12.15 中 为 “用 于 A 的 处 理 器 ”后 面 括 弧 内 的 数字 )。 
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马 





hello hello _ world0 

hello_hello_world() = 
Rubinius > C 语 言 扩展 库 
rd_str new2() 

] 于 A 的 3 
A 字符 申 对 象 



































帧 处 理 器 表 术 
NativeMethodFrame 








全 局 处 理 需 列表 





图 12.15 (3) 生成 字符 串 对 象 





接 下 来 ， 从 C 语言 扩展 库 调 用 Rubinius 的 rb_funcall(0) 函数 ， 这 样 一 来 就 会 从 Rubinius 调 
用 出 C 语言 扩展 库 的 hello_world() 国 数 。 因 为 已 经 从 Rubinius 调用 出 了 C 语言 扩展 库 的 函数 ， 
所 以 还 会 往 调 用 栈 里 堆积 NativeMethodFrame。 此 时 的 状态 如 图 12.16 所 示 。 














| hello_hello world() 
hello_hello_ world() 
> 





Rubinius 


C 语 言 扩 展 库 





rb_funcall() 











用 于 A 的 
处 理 需 (2) hello_world() 


. 























12.16 (4) 调 用 hello_world() 





这 里 有 一 点 需要 大 家 注意 ， 那 就 是 要 把 对 象 A 传递 给 hello_world() 函数 。 
对 象 A 已 经 生成 了 处 理 器 (图 12.15)。 当 把 这 样 的 对 象 交 给 C 语言 扩展 库 时 ， 只 会 对 处 
理 器 内 的 计数 需 执行 增 量 操作 ， 并 将 其 追加 到 处 理 器 表格 。 此 时 并 没有 生成 新 的 处 理 需 。 
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| hello_hello_world() 


Rubinius 


hello hello world a 
-ero_wonc0 :| CC 语言 扩展 库 
rb_funcall() 














用 于 A 的 

ee hello_world() 
上 er B 的 
人 处理 器 (1) rb_str new2() 





























字符 串 对 象 








全 局 处 理 需 列表 





图 12.17 (5) 生成 字符 串 对 象 
在 hello_world() 函数 内 也 生成 了 字符 串 对 象 ， 我 们 将 其 称 为 对 象 B。 这 里 还 没有 为 对 
象 B 生 成 处 理 硕 ， 因 此 我 们 用 Rubinius 生成 处 理 絮 ， 将 其 追加 到 各 个 全 局 处 理 絮 列表 和 帧 
表格 里 。 此 时 的 状态 如 图 12.17 所 示 。 





| hello_hello_world() 











hello hello world() ee 
-一 -一 >| C 语言 扩展 库 





Rubinius 





用 于 A 的 
处 理 帮 (1) 
于 B 的 
处 理 天 (0) 


























释放 时 对 处 理 顺 的 
计数 器 执行 减 量 操作 











图 12.18 (6) 结 束 hello_world() 函数 


352 第 12 章 Rubinius 的 垃圾 回收 





执行 完 hello_world() 函数 后 ， 对 应 这 个 函数 的 NativeMethodFrame 会 被 释放 一 块 内 存 。 
因此 NativeMethodFrame 内 的 帧 处 理 器 表格 也 会 一 起 被 释放 。 

这 里 重点 在 于 对 释放 时 保存 的 处 理 器 (在 这 里 指 的 是 用 于 B 的 处 理 器 ) 的 计数 器 执行 减 
量 操作 。 这 里 所 说 的 处 理 融 是 指 在 与 NativeMethodFrame 对 应 的 C 语言 扩展 库 的 函数 内 使 用 
的 处 理 器 。 因 为 这 个 因数 已 经 执行 完毕 ， 所 以 必须 对 函数 所 引用 的 对 象 的 处 理 器 的 引用 数量 
执行 减 量 操作 。 

如 图 12.18 所 示 ，hello_world() 函数 执行 结束 后 ， 各 个 处 理 器 都 被 执行 了 减 量 操作 。 

当 hello_hello_world() 函数 执行 结束 后 ，NativeMethodFrame 也 同样 会 被 释放 内 存 。 
这 样 能 从 全 局 处 理 器 列表 搜索 到 的 所 有 人 处理 器 的 计数 器 值 就 都 成 了 0( 图 12.19)。 


























| hello_hello_world() 


C 语 言 扩展 库 





Rubinius 




















器 (0) 















释放 时 对 处 理 咒 的 
计数 器 执行 减 量 操作 


NativeMethodFrame 





全 里 右 列 表 





图 12.19 ” (7) 结束 hello_hello_world() 函数 


12.4.8 ”与 GC 的 关系 


现在 已 经 知道 处 理 器 的 管理 方法 了 ,但 是 它 跟 GC 是 怎么 联系 上 的 呢 ? 

在 前 面 的 12.4.1 节 中 已 经 向 大 家 解释 过 了 ,“ 用 于 C 语言 扩展 库 的 处 理 器 ”属于 根 的 一 
部 分 。 事 实 上 这 个 “用 于 C 语言 扩展 库 的 处 理 器 ”就 是 我 们 刚刚 讲 的 全 局 处 理 器 列表 。 

GC 把 全 局 处 理 器 列表 作为 根 的 一 部 分 来 执行 搜索 。 此 时 GC 只 会 把 处 理 器 内 计数 器 值 
大 于 等 于 1 的 对 象 视 为 “确实 活着 ”的 对 象 。 因 为 扩展 库 没 有 引用 计数 器 值 为 0 的 处 理 需 ， 
所 以 他 们 会 被 单纯 无 视 掉 (图 12.20 )。 
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Rubinius 























用 于 B 的 
理 器 (0) 











全 局 处 理 器 列表 
无 视 引用 计数 器 什 
为 0 的 处 理 器 

















图 12.20 查找 全 局 处 理 器 列表 


GC 结束 后 ， 搜 索 全 局 处 理 器 列表 ， 释 放 计 数 器 值 为 0 的 处 理 器 (图 12.20 中 的 B)。 
像 这 样 ， 通 过 使 用 与 “引用 计数 法 ”类 似 的 形式 来 管理 处 理 需 ， 即 使 在 C 语言 扩展 库 的 























函数 执行 过 程 中 启动 GCC， 也 能 切实 释放 非 活动 对 象 。 


12.4.9 ”Rubinius 和 C 语 言 扩 展 库 的 交换 


Rubinius 


iltin/array.cpp 
iltin/array.hpp 
也 VM 数据 的 struct/value 定义 




















也 的 header 








C 语言 扩展 库 


Ruby C-API 








capi/capi.hpp < 


capi/capi.cpp 


capi/array.cpp 


图 12.21 Rubinius 和 C 语 言 扩展 库 的 关系 


请 看 图 12.21。Rubinius 和 C 语言 











言 扩 展 库 的 交换 由 图 内 的 Ruby C-API 全 权 处 理 。 之 前 讲 














的 管理 处 理 需 的 功能 也 全 是 由 这 个 Ruby C-API 实 现 的 。 


E 容 为 目标 的 ， 这 就 意 











此 外 ，Rubinius 提供 的 C-API 是 以 与 CRuby 提供 的 C-API 完全 章 
味 着 CRuby 的 C 语 言 扩展 库 可 以 直接 在 Rubinius 上 运作 。 
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@@ 


填补 C++ 和 CC 语言 的 差距 

大 家 不 要 忘 了 Rubinius 是 用 C++ 写 的 。 

Rubinius 和 CRuby 使 用 的 语言 (C++ 和 C 语言 ) 有 所 不 同 ， 对 象 的 结构 也 大 相 径 庭 。 那 么 
该 怎么 填补 这 些 差距 呢 ? 

Rubinius 的 Ruby C-API 在 C++ 平台 中 传递 对 象 时 ， 会 用 CRuby 生成 一 次 被 使 用 对 象 的 
结构 体 ， 复 制 并 传递 对 象 需要 的 信息 。 举 个 例子 ， 传 递 对 象 Float 时 的 流程 如 图 12.22 所 示 。 



















































































Rubinius 






Ruby C-API 


CRuby 的 结构 体 
Rubinius (C++) 的 类 (新 生成 ) 


double value double value 
复制 值 


rb _ float new() C 语 言 扩展 库 








12.22 ”Float 对象 的 变换 


























这 里 有 一 点 需要 大 家 注意 ， 那 就 是 必须 完全 同步 Rupinius 里 的 对 象 所 包含 的 信息 和 CRuby 
# 式 的 结构 体 所 包含 的 信息 。 也 就 是 说 ， 如 果 在 C 语言 扩展 库 这 边 变 更 了 结构 体 中 的 值 ， 变 更 的 
直 也 必须 反应 在 Rubinius 中 的 对 象 内 。 
















































































12.4.10 ”我 们 能 实际 运用 Rubinius 的 Ruby C-API 吗 


我 们 能 实际 运用 Rubinius 的 Ruby C-API 吗 ? 从 结论 上 讲 ， 还 不 能 。 最 大 的 原因 就 在 于 “有 
很 多 尚未 实现 的 部 分 ”。 

虽然 Rubinius 的 目标 是 提供 能 与 Ruby (CRuby) 完 全 兼容 的 C-API, 但 是 现 阶段 还 有 很 
多 没 实现 的 地 方 ， 不 能 说 做 到 了 完全 兼容 (在 笔者 写作 本 书 时 ， 感 觉 已 实现 的 部 分 大 概 有 百 
分 之 下 并 十 )s 

不 过 还 是 有 希望 的 。 现 在 bigdecimal 、digest、readline 这 三 种 标准 附件 从 CRuby 被 移植 
到 了 Rubinius。 它 们 几乎 都 能 直接 运作 。 日 后 只 要 继续 从 CRuby 向 Rubinius 移植 ，C-API 也 
会 日 渐 成 熟 ， 那 就 离 完全 兼容 不 远 了 。 
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除了 兼容 性 还 有 一 个 问题 ， 那 就 是 Rubinius 比 CRuby 的 C 语言 扩展 库 要 “ 慢 ”。 
为 Rubinius 采用 的 是 准确 式 GCC， 所 以 需要 处 理 器 。 另 一 方面 ， 又 因为 CRuby 是 保守 
式 GC， 所 以 我 们 什么 都 不 用 管 (至 于 保守 式 GC 写 起 C 语言 扩展 库 来 有 多 容易 ， 想 必 大 家 已 








经 刻 在 骨子里 了 吧 )。 











而 且 人 们 也 为 填补 Rubinius 和 CRuby 的 差距 下 了 一 番 功 夫 。 因 为 这 些 功夫 都 会 是 额外 


负担 ， 所 以 比 起 CRuby, Rubinius 怎么 说 都 在 速 











度 上 占 和 劣势 。 这 样 一 来 ，C 语言 扩展 库 的 优 














点 一 一 “高 速 运作 ”的 魅力 就 打 了 折扣 。 因 为 本 来 是 出 于 提高 速度 的 目的 才 写 C 语言 扩展 库 的 ， 





所 以 要 是 执行 起 来 慢 就 没有 意义 了 。 








考虑 到 这 些 问题 ，Rubinius 用 FFI 重 写 了 一 部 分 扩展 库 。 关 于 FTI， 我 们 将 在 下 一 节 中 


介绍 。 


12.4.11 FFI 





FFI(Foreign Function Interface ) 用 一 句 话 说 就 是 “与 其 他 语言 简单 地 进行 交换 的 接口 ”。 











除了 FFI 外， 通 








常 还 会 使 用 Common Lisp 和 Scheme 等 。 


在 这 里 我 们 把 FFI 定义 为 “从 Rubinius 简单 地 调用 C 库 的 函数 的 构造 ”。 


C 语 言 扩展 











用 函数 





FFI 





图 12.23 FFI 的 定位 








使 用 Rubinius 的 FFI 就 能 非常 简单 地 调用 C 库 的 函数 。 举 个 例子 ,调用 C 语言 的 printf 0) 





函数 的 代码 如 代码 清单 12.3 所 示 。 


代码 清单 12.3: ruby_printf.rb 
module Kernel 
attach_function 'printf', 


ruUby printf, [string, 


end 


ruby_printf ("Hello World") 
#=> Hello World 


非常 简单 吧 。 





这 里 大 家 也 许 会 想 :“ 这 样 一 来 不 就 也 能 写 C 语言 扩展 库 了 吗 ?” 但 是 FFI 重视 的 是 “ 


ant], 
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来 也 很 轻松 。 





的 扩展 库 应 该 都 会 


垃圾 回收 





方便 "。 因 为 Ruby 比 C 语言 的 代码 量 小 ,所 以 很 容易 写 新 的 库 ， 维 护 起 


此 外 ，Rubinius 的 方针 是 “用 Ruby 实现 Ruby”。 考 虑 到 这 一 点 ,今后 追加 到 Rubinius 








用 FFI 写 吧 。 此 外 ， 人 们 也 尝试 了 把 CRuby 的 标准 附件 C 语言 扩展 库 用 


FFI 移植 到 Rubinius， 如 socket 已 经 全 部 用 FFI 改写 了 。 
那么 为 什么 我 们 还 准备 了 Ruby C-API 呢 ? 这 肯定 是 因为 不 想 浪费 Ruby 现 有 的 资源 吧 。 


Ruby (CRuby) 已 经 

















有 丰富 的 C 语言 扩展 库 了 ， 笔 者 认为 ， 开 发 者 或 许 是 想 原 样 利 用 这 些 资 


源 才 实现 了 C-API 吧 。 


顺便 一 担 ， 因 为 FFI 是 在 Rubinius 的 VM 平台 上 运作 的 ， 所 以 指针 都 在 准确 式 GC 的 管 


理 范围 之 内 。 








表 12.5 Rubinius 的 C-API 和 FFI 的 差别 








] CRuby 的 资源 (C 语 言 扩展 库 ) 生成 、 重 写 用 于 Rubinius 的 库 























直接 使 用 CRuby 的 C 语 言 扩展 库 比 C 语 言 写 起 来 容易 ， 读 起 来 方便 



































还 不 能 跟 CRuby 完全 兼容 符合 “用 Ruby 实 现 Ruby” 的 方针 











FFI 和 Ruby/DL 有 什么 不 同 ? 

CRuby 有 一 个 叫 作 Ruby/DL 的 标准 附件 库 ， 它 也 是 “从 Ruby 调用 C 库 的 构造 。 那 么 它 
跟 Rubinius 的 FFI 有 什么 不 同 呢 ? 

实际 上 没有 不 同 ， 它 们 的 用 途 完全 一 样 。 那 么 为 什么 要 发 明 FFI 呢 ? 
































据 笔者 推测 ， 


1.Ruby/DL 日 





原因 有 如 下 两 点 。 








和 API 很 复杂 (很 难 使 用 ) 

















2. 因此 Ruby/DL 才 没有 被 广泛 使 用 





正 因为 如 此 ， 





Rubinius 中 才 单 独 实现 并 应 用 了 FFI， 而 不 是 Ruby/DL 吧 。 





12.4.12 ”内 许 对 象 和 指针 的 区 别 
这 一 节 笔 者 想 讲 讲 跟 之 前 稍微 不 同 的 话题 ， 就 是 “内 瞬 对 象 和 指针 的 区 别 ”。 
这 里 所 说 的 “内 椒 对 象 ” 指 的 是 不 经 过 VM Heap 的 对 象 分 配 ， 而 把 对 象 的 信息 直接 般 和 人 
针 本 身 的 对 象 。 它 跟 C++ 上 的 int 、double、float 等 “直接 数据 ”是 不 同 的 东西 。 
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Rubinius 的 内 栎 对 象 包括 以 下 几 种 。 


1. Fixnum (数值 ) 


2. Symbol (符号 ) 


3.true、 false、nil、undef 


下 面 就 以 其 中 的 Fixnum 为 例 来 说 明 吧 。 
Fixnunm 不 会 分 配 VM Heap 的 对 象 ， 而 是 把 信息 能 入 指针 本 身 。 




























String 的 指针 


0x03152...00 


指向 VM Heap 








内 分 配 的 对 象 
Fixnum 的 指针 
数值 直接 存 人 


图 12.24 内容 对 象 ( Fixnum ) 





























为 什么 要 这 么 办 呢 ?” 这 是 为 了 实现 高 速 化 。 因 为 Fixnum (数值 ) 是 经 常 被 使 用 的 对 象 ， 
所 以 把 它 一 个 一 个 地 分 配 到 VM Heap 太 浪费 时 间 和 资源 了 。 因 此 才 通 过 将 信息 本 身 航 入 指 
针 来 实现 高 速 化 。 不 过 如 果 指 针 是 32 位 的 话 ，Fixnum 只 能 处 理 不 超过 31 位 的 数值 。 如 果 超 
过 了 31 位， 也 就 超过 了 幅 入 的 信息 量 ， 这样 一 来 Fixnum 就 会 把 对 象 当成 Bignum 分配 到 VM 
Heap。 

然而 这 样 的 话 问题 就 来 了 :“ 要 怎么 执行 GC 呢 ?” 

这 些 内 和 伦 对 象 跟 指针 一 起 挨 杂 在 根 里 。 因 为 我 们 不 能 通过 GC 复制 算法 来 重 写 内 藤 对 象 
的 值 ， 所 以 需要 通过 一 些 方法 来 区 别 内 和 藤 对 象 和 指针 ， 来 无 视 内 和 藤 对 象 的 值 。 

区 别 的 方法 就 是 为 内 藤 对 象 设 置 标志 位 。 关 于 这 一 点 ， 我 们 来 看 一 下 代码 。 
























































vm/oop.hpp 
26 | #define TAG_FIXNUM Ox1 
27 | #define TAG_FIXNUM_SHIFT 1 
28 | #define TAG_FIXNUM MASK 1 


36 | #define APPLY_FIXNUM_TAG(v) ((Object*)(((intptr_t)(v) << TAG_FIXNUM_SHIFT)\ 
| TAG_FIXNUM)) 
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第 36 行 的 代码 的 作用 是 给 C++ 的 int 设置 标志 位 ， 并 转换 为 Fixznum。 在 这 里 向 左 偏 移 
了 1 位 , 跟 1 做 了 一 下 OR。 


100010101 C++ 的 int 
1000101011 Fixnum 


当然 ， 如 果 对 设置 了 标签 的 数值 (Fixnum) 执行 加 法 运算 ， 就 会 返回 跟 所 求 结果 不 同 的 答 
案 。 因 此 在 进行 加 减 运算 等 操作 时 ， 要 先 拿 掉 数值 (Fixnum) 内 的 标签 位 再 执行 操作 。 


vm/oop.hpp 
37 | #define STRIP_FIXNUM_TAG(v) (((intptr_t)v) >> TAG_FIXNUM_SHIFT) 


vm/builtin/fixnum.hpp 


20 static Fixnum* from(native_int num) { 

2 return (Fixnum*)APPLY_FIXNUM_TAG (num); 
22 } 

23 

24 native_int to_native() const { 

25 return STRIP_FIXNUM_TAG(this); 

26 } 

35 // Ruby.primitive! :fixnum_add 

36 Integer* add(STATE, Fixnum* other) { 

37 native_int r = to_native() + other->to_native(); 
41 return Fixnum: :from(r) ; 

43 } 











成 员 函 数 aad(0) 执行 的 是 Fixmun 类 的 加 法 运算 处 理 。 请 大 家 注意 ， 这 里 是 先 在 第 37 行 
通过 to_native() 函数 用 宏 STRIP_FIXNUM_TAG() 清除 标签 后 ， 才 进行 的 加 法 运算 。 
其 他 内 瞬 对 象 的 标签 如 表 12.6 所 示 。 





表 12.6 ”内 骨 对 象 和 标记 的 对 应 


Fixnum (数值 ) 





true 、false、nil、undef 


Symbol( 符 号) 


























为 什么 能 通过 设置 标记 来 判断 指针 呢 ? 这 是 因为 在 分 配对 象 的 内 存 时 返回 的 地 址 是 按 4 
字 节 对 齐 的 ， 指 针 的 低 2 位 肯定 是 0。 大 家 看 一 眼 表 12.6 就 会 发 现 , 低 2 位 之 中 一 定 有 1 
也 就 是 说 ， 要 想 判断 指针 是 不 是 内 矢 对 象 ， 只 要 检查 低 2 位 内 有 没有 1 就 可 以 了 。 
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PF 有 A: 漳 GC 复制 算法 


这 一 节 我 们 来 看 看 如 何 实现 Rubinius 的 新 生 代 GC 一 一 GC 复制 算法 吧 。 这 个 算法 和 第 4 
章 中 介绍 的 Cheney 的 GC 复制 算法 基本 相同 。 


12.5.1 ”整体 流程 


在 进入 正题 前 ， 先 来 解释 一 下 在 本 节 会 频繁 出 现 的 “搜索 ”。 在 GC 复制 算法 中 ， 如 果 在 
查找 某 个 对 象 内 部 时 GC 发 现 了 可 以 移动 到 To 空间 的 子 对 象 ， 这 个 子 对 象 就 会 马上 被 复制 
到 To 空间 。 也 就 是 说 ,“ 搜 索 ” 的 途中 也 执行 “复制 "。 为 了 讲解 起 来 更 容易 ， 我 们 规定 本 章 
中 的 “搜索 ”包含 “把 对 象 内 的 子 对 象 复制 到 To 空间 ”的 意思 。 

那么 来 看 一 下 GC 复制 算法 的 整体 流程 吧 。 

GC 复制 算法 按照 以 下 顺序 进行 操作 。 


























1. 搜索 从 记录 集 引 用 的 对 象 
2. 复制 从 根 引用 的 对 象 

3. 搜索 复制 完毕 的 对 象 

4. 垃圾 对 象 的 后 处 理 


下 面 就 按照 从 上 到 下 的 顺序 一 个 个 来 看 吧 。 





新 生 代 空间 





From 空间 


To 空间 





图 12.25 (1) 搜 索 从 记录 集 引 用 的 对 象 





首先 搜索 从 记录 集 引用 的 对 象 ， 将 其 子 对 象 复制 到 To 空间 。 复 制 完 一 个 子 对 象 ， 父 对 
象 内 的 原始 地 址 就 会 被 重 写成 目标 空间 的 地 址 。 
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Rubinius 的 GC 是 分 代 垃 圾 回收 ， 因 此 必然 需要 通过 记录 集 等 手段 来 记录 新 生 代 GC 和 
老年 代 GC 之 间 的 引用 。 关 于 记录 集 在 第 7 草 中 有 详细 说 明 。 














老年 代 空间 新 生 代 空 间 


From 空间 





图 12.26 (2) 复 制 从 根 引 用 的 对 象 


接 下 来 把 从 根 内 部 引用 的 对 象 复制 到 To 空间 ， 把 根 内 的 指针 重 写 到 目标 空间 ， 再 把 
forwarding 指针 设 定 给 原始 空间 。 


普 升 链表 





新 生 代 空间 


From 空间 





12.27 ” (3) 复制 子 对 象 





把 从 根 引 用 的 所 有 对 象 全 复制 到 To 空间 后 ， 接 下 来 就 要 搜索 To 空间 内 的 对 象 ， 并 把 其 
子 对 象 反 复 复制 到 To 空间 。 
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当 把 对 象 从 From 空间 复制 到 To 空间 时 ， ea pe! 。 如 果 年 龄 满足 成 为 老年 
Se 件 ， 这 个 对 象 就 会 被 晋升 ， 并 被 记录 到 晋升 链表 里 。 这 个 晋升 链表 负责 记录 那些 指向 
C 过 程 中 晋升 的 对 象 的 指针 。 另 外 ， | To 空间 。 


F 代 空间 新 生 代 空间 








From 空间 


器 口 口 口 口 


后 处 理 To 空间 





12.28 (4) 后 处 理 


如 果 所 有 需要 搜索 的 对 象 都 搜索 完了 ， 就 该 对 残留 在 From 空间 里 的 垃圾 对 象 执行 后 
理 了 。 后 处 理 的 具体 内 容 会 在 之 后 的 12.5.10 节 中 为 大 家 详细 说 明 。 


12.5.2 collect() 
既然 大 家 已 经 掌握 了 整体 流程 ， 那 么 下 面 赶 紧 来 看 看 代码 吧 。 
在 这 里 用 BakerGc 类 的 成 员 函 数 collect() 来 执行 CC 复制 算法 。 因 为 代码 量 有 150 行 ， 
稍微 有 点 多 ， 所 以 这 里 分 成 4 部 分 为 大 家 讲解 。 





vm/gc/baker.cpp:collect() 


85 void BakerGC::collect(GCDatag data) { 


92 
93 Object* tmp; 
94 ObjectArray *current_rs = object_memory->remember._set; 


95 














/* (1) 搜索 从 记录 集 引 用 的 对 象 */ 





/* (2) 复制 从 根 引用 的 对 象 */ 





/* (3) 搜索 复制 完毕 的 对 象 */ 


/* (4) 垃圾 对 象 的 后 处 理 */ 





220 /* 替换 To 空间 和 From 空 间 */ 
221 Heap *x = next; 





222 next = current; 
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223 





current = x; 


next->reset(); 


在 执行 完 (1) 到 (4) 的 操作 后 ， 替 换 next (To 空间 ) 和 current (From 空间 )。 负责 执行 这 
项 操作 的 是 第 220 行 到 第 224 行 的 代码 。 替 换 完毕 后 调用 reset ()， 初 始 化 堆 中 设 定 的 值 。 


12.5.3 





(人 搜索 从 记录 集 引 用 的 对 象 


首先 搜索 记录 集 内 的 指针 所 指向 的 对 象 。 


vm/gc/baker.cpp:collect() 


85 


232 





void BakerGC::collect(GCData& data) { 


Object* tmp; 


ObjectArray *current_rs = object_memory->remember_set; 


object_memory->remember_set = new 0bjectArray(0) ; 


total_objects = 0; 


for (ObjectArray::iterator oi = current_rs->begin(); 


oi != current_rs->end(); 
++0i) { 
tmp = *oi; 


if(tmp) { 


tmp->clear_remember() ; 


scan_object (tmp); /* 复制 子 对 象 */ 


delete current_rs; 











/* (2) 复制 从 根 引 





二 


的 对 象 */ 








/* (3) 搜索 复制 完毕 的 对 象 */ 


/* (4) 垃圾 对 象 的 后 处 理 */ 


因为 这 里 起 了 恰当 的 变量 名 和 函数 名 ， 所 以 大 家 可 以 一 





边 想 象 着 操作 一 边 往 下 看 。 
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第 94 行 负责 把 指向 现在 的 记录 集 的 指针 存 人 局 部 变量 current_rs 里 。 
接 下 来 在 第 9 行 把 obbjectarray 类 的 实例 设 为 new, 把 这 个 实例 作为 新 的 记录 集 存 人 
object_memory->remember_set 中 。 ObjectArTray 是 以 Object 为 元 素 的 vector 类 (动态 数组 ) 的 别名 。 

















vm/gc/gc.hpp 
19 | typedef std::vector<0bject*> ObjectArray; 
从 第 105 行 到 第 119 行 的 循环 中 按 顺 序 取出 记录 集 里 记录 的 对 象 的 指针 ， 在 第 116 行 用 
成 员 函 数 clear_remember() 将 对 象 的 标记 内 的 Remember 位 设 为 0。 


vm/oop.hpp 
320 void clear_remember() { 
321 Remember = 0; 
322 } 


同样 用 循环 内 的 scan_object() 函数 搜索 指定 的 对 象 ， 把 对 象 内 的 子 对 象 复制 到 To 空间 。 
关于 这 个 也 数 我 们 会 在 之 后 的 12.5.9 节 详 细 说 明 ， 现 在 大 家 只 要 掌握 个 大 概 就 好 。 
在 第 121 行 对 调查 完 的 current_rs 执行 delete。 


12.5.4 “ 写 入 屏障 


因为 提 到 了 记录 集 ， 在 此 就 讲 一 下 写 入 屏障 吧 。 
如 第 7 章 中 所 述 ， 写 人 屏障 就 是 把 从 老年 代 到 新 生 代 的 引用 记录 在 记录 集中 的 手法 。 下 
面 就 让 我 们 来 看 看 Rubinius 是 怎么 实现 写 人 屏障 的 吧 。 


























vm/builtin/object.cpp 
582 void Object::write_barrier(STATE, void* obj) { 
583 state->om->write_barrier(this, reinterpret_cast<0bject*>(0bj)); 


584 » 

















这 个 叫 作 write_barrier() 的 成 员 函 数位 于 0bject 类 中 。 第 582 行 的 宏 STATE() 是 把 
VM 类 定义 为 参数 的 宏 。 


vm/prelude.hpp 


34 | #define STATE rubinius::VM* state 
VM 类 的 om 里 存 有 0bjectMemory 类 的 实例 。 下 面 就 来 看 看 这 个 ObjectMemory 类 的 成 员 
函数 write_barrier() 吧 。 


vm/objectmemory.hpp 


114 void Write_barrier(0bject# target, Object* val) { 
115 if(target->remembered_p()) return; 
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116 if(!REFERENCE_P(val)) return; 

i147 if(target->zone == Young0bjectZone) return; 
i118 if(val->zone != Young0bjectZone) return; 
119 

120 remember_object (target); 

121 } 




















参数 target 是 发 出 引用 的 对 象 ，val 是 引用 的 目标 对 象 。 
第 115 行 到 第 118 行 的 if 语句 的 条 件 分 别 如 下 所 示 。 


。 第 115 行 : 发 出 引用 的 对 象 是 否 已 经 记录 在 记录 集 里 了 ? 

。 第 116 行 : 引用 的 目标 对 象 是 否 为 指针 (是 否 为 内 座 对 象 )? 
。 第 117 行 : 发 出 引用 的 对 象 是 否 为 新 生 代 对 象 ? 

。 第 118 行 : 发 出 引用 的 对 象 是 否 为 新 生 代 对 象 ? 








以 上 条 件 中 只 要 有 一 个 符合 情况 ，target 就 不 会 被 记录 到 记录 集中 。 也 就 是 说 ， 这 些 
if 语句 是 一 项 检查 处 理 ， 用 于 弹 开 那些 不 能 成 为 写 入 屏障 对 象 的 对 象 。 
在 第 120 行 调 用 成 员 函 数 Temember_object() ， 来 将 指针 记录 到 记录 集 里 。 





vm/objectmemory.cpp 


197 void 0bjectMemory: :remember_object(0bject# target) { 


200 if(target->remembered_p()) return; 
201 target->set_remember(); 

202 remember_set->push_back(target); 
203 了 


第 201 行 的 成 员 函 数 set_remember() 负责 将 对 象 标记 内 的 Remember 位 设 为 1。 可 见 这 
跟 clear_remember() 正好 相反 。 设 置 Remember 位 后 ， 指 针 就 会 被 追加 到 remember_set 里 。 
这 样 就 实现 了 Rubinius 的 写 人 屏障 。 

下 面 让 我 们 来 看 看 在 哪里 插入 了 这 屏障 。 在 往 老 年 代 对 象 内 的 成 员 变量 里 存 人 对 
象 时 必须 设置 写 人 屏障 。 








vm/builtin/object.hpp 
22 | #define attr_writer(name, type) \ 
23 void name (STATE, type* obj) { \ 


24 name ## _ = obj; \ 

25 if(zone == Mature0bjectZone) this->write_barrier(state, obj); \ 
26 

34 | #define attr_reader(name, type) type* name() { return name ## _; } \ 





35 const type* name() const { return name ## _; } 
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42 | #define attr_accessor(name, type) attr_reader(name, type) \ 


43 


在 Rubinius 里 定义 了 宏 attr_writer()、 attr_reader() 


attr_writer(name, type) 


以 及 attr_accessor()。 应 该 有 不 少 


Ruby 用 户 见 过 这 些 宏 吧 。 实 际 上 Ruby 中 也 有 跟 这 些 宏 同 名 的 方法 ,它们 的 作用 也 相同 。 在 
这 里 用 宏 attr_writer() 来 定义 成 员 变 量 的 setter， 用 宏 attr_reader() 来 定义 成 员 变 量 的 
getter，attr_accessor() 则 被 用 于 同时 定义 getter 和 setter。 





在 此 希望 大 家 注意 一 点 ， 那 就 是 在 第 25 行 用 到 了 wr 
各 个 成 员 变 量 的 setter 里 都 存 有 Write_barrier()。 

















ite_barrier()。 也 就 是 说 ， 对 象 的 


下 面 以 Array 类 为 例 来 看 一 下 使 用 attr_accessor() 的 例子 。 


vm/builtin/array.hpp 





bb class Array : public Object { 
15 private: 

16 Fixnum* total_; // slot 

站 Tuple* tuple_; // slot 

18 Fixnum* start_; // slot 

19 Object* shared_; // slot 

20 

21 public: 

22 /* accessors */ 

23 

24 attr_accessor(total, Fixnum); 
25 attr_accessor(tuple, Tuple); 
26 attr_accessor(start, Fixnum); 
2 attr_accessor(shared, Object); 


在 把 指针 存 人 其 中 定义 的 total_ 等 成 员 变 量 时 ， 必 须 使 用 setter， 并 且 要 保证 确实 对 这 


个 setter 设置 了 写 人 屏障 。 
虽然 这 次 是 以 Array 类 为 例 , 不 过 其 他 类 也 同样 通 
也 就 是 说 ， 对 于 其 他 类 的 成 员 变 量 ， 


12.5.5 ” (2) 复制 从 根 引 用 的 对 象 


下 面 要 讲 的 是 复制 从 根 引 用 的 对 象 的 相关 内 容 。 
大 家 应 该 还 记得 吧 ，Rubinius 的 根 有 以 下 几 种 。 









































1. 内 置 类 、 模 块 、 符 号 
2. VM 的 调用 栈 


过 attr_accessor() 定义 了 setter。 


我 们 也 设置 了 写 入 屏障 。 
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3. GC 正在 保护 的 对 象 
4. 用 于 C 语言 扩展 库 的 处 理 器 


因为 这 些 复 制 操作 的 内 容 几 乎 相同 ， 所 以 这 次 就 只 讲 第 1 种 。 


vm/gc/baker.cpp:collect() 
85 void BakerGC::collect(GCData& data) { 











/* (1) 搜索 从 记录 集 引 用 的 对 象 */ 








122 /* 内 置 类 、 模 块 、 符 号 */ 


123 for(Roots::Iterator i(data.roots()); i.more(); i.advance()) { 
124 tmp = i->get(); 
125 if(tmp->reference_p() && tmp->young_object_p()) { 
126 i->set(saw_object (tmp)); 
127 } 
128 下 
/* 省 略 */ 


/* (3) 搜索 已 复制 完毕 的 对 象 */ 


/* (4) 垃圾 对 象 的 后 处 理 */ 





232 } 





data.roots 为 双 癌 链表 ， 元 素 内 存 有 指向 内 置 类 的 指针 ， 实 际 负责 取出 这 些 指 针 的 是 第 
124 行 的 成 员 函 数 get ()。 

在 第 125 行 检 查 取出 的 指针 。reference_p() 负责 检查 指针 是 否 为 内 骸 对 象 ，young_ 
object_ 负责 检查 指针 所 指 的 对 象 是 否 在 新 生 代 空间 。 
通过 这 些 检查 后 ， 就 要 开始 复制 对 象 了 。 复 制 对 象 的 操作 是 由 成 员 函 数 saw_object () 
执行 的 。saw_object() 成 功 复制 完 对 象 后 会 返回 目标 空间 的 地 址 。 如 果 对 象 已 经 被 复制 了 ， 
那么 saw_object() 就 会 返回 forwarding 指针 (指向 目标 空间 的 指针 )。 在 调用 完 saw_object () 
后 ， 用 成 员 函 数 set () 把 返回 的 目标 空间 地 址 设 定 为 根 。 也 就 是 说 ， 在 这 里 执行 了 根 的 重 写 
操作 。 
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From 空间 





set() 


六 
7 
17 
2 
7 
7 
1 
~ | | 


data.roots 


图 12.29 重 写 根 


12.5.6 _ saw_object() 
saw_object() 负责 执行 对 象 的 复制 操作 ， 下 面 让 我 们 一 起 来 看 看 其 内 容 吧 。 





vm/gc/baker.cpp 
32 Object* BakerGC::saw_object(0bject* obj) { 
33 Object* copy; 
34 
39 if(!obj->reference_p()) return obj; 
40 
41 if(obj->zone != Young0bjectZone) return obj; 
42 
43 if (obj->forwarded_p()) return obj->forward() ; 
44 
48 if (next->contains_p(obj)) return obj; 
/* 后 半 部 分 */ 
68 下 








在 第 43 行 调用 obj 的 forwarded_p()。forwarded_p() 负责 返回 是 否 设 定 了 forwarding 指针 。 
如 果 条 件 为 真 ，forwarded_p() 就 会 返回 obj 的 forwarding 指针 。 

第 48 行 的 next 指 的 是 To 空间 。 如 果 obj 为 To 空间 内 的 对 象 ， 就 不 进行 复制 。 这 样 一 
来 obj 就 会 被 原样 返回 。 








vm/gc/baker.cpp 


32 Object* BakerGC::saw_object(0bject* obj) { 
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/* 前 半 部 分 */ 


50 if(unlikely(obj->age++ >= lifetime)) { 

5 copy = object_memory->promote_object (obj); 

52 

53 promoted_push (copy); 

54 } else if(likely(next->enough_space_p( 
obj->size_in_bytes(object_memory->state)))) { 

55 Copy = next->copy_object(object_memory->state, obj); 

56 total_objects++; 

57 } else { 

58 copy = object_memory->promote_object (obj); 

59 promoted_push(copy); 

60 了 

66 obj->set_forward(copy) ; 

67 return copy; 

68 了 








第 50 行 的 obj->age 负责 计算 obj 的 年 龄 ， 这 里 的 年 龄 指 的 是 obj 当 过 多 少 次 GC 复制 
算法 (新 生 代 GC) 的 对 象 。 当 age (年 龄 ) 为 1 时 ， 就 表示 这 个 对 象 过 去 只 当 过 一 次 GC 复制 
算法 的 对 象 。1lifetime 是 视 为 新 生 代 的 年 龄 的 闷 值 。 一旦 age 超过 1ifetime， 这 个 对 象 就 
到 了 老年 代 的 年 龄 ， 我 们 就 必须 将 其 移动 (晋升 ) 到 老年 代 空 间 了 。 

第 51 行 的 成 员 函 数 promote_object() 负责 将 对 象 移动 (晋升 ) 到 老年 代 空 间 。 

如 第 53 行 所 示 ， 我 们 对 晋升 后 的 对 象 调用 promoted_push() ， 将 其 指针 记录 在 晋升 链表 
中 。 在 此 必须 把 在 GC 复制 算法 中 晋升 了 的 所 有 对 象 都 记录 到 晋升 链表 里 。 

在 第 54 行 检查 To 空间 里 还 有 没有 可 以 复制 的 空闲 空间 。size_in_bytes() 负责 返回 对 
象 参数 的 大 小 ,成员 函数 enough_space_p() 则 负责 调查 还 有 没有 指定 大 小 的 空闲 空间 。 

如 果 To 空间 里 还 有 空闲 空间 ， 程 序 就 把 对 象 复制 过 去 。 第 55 行 的 copy_object() 函数 

负责 执行 这 项 操作 。 

如 果 To 空间 里 已 经 没有 空闲 空间 了 ,， 那 就 只 好 让 对 象 晋升 了 。 执 行 这 项 操作 的 是 第 58 
和 第 59 行 的 代码 。 

这 里 有 一 个 问题 : 因为 在 GC 复制 算法 中 From 空间 和 To 空间 大 小 相同 ， 所 以 应 该 没 必 
要 专门 去 调查 To 空间 里 的 空闲 空间 才 对 ， 那 第 58 行 和 第 59 行 的 操作 还 有 必要 存在 吗 ? 笔 
者 试 着 用 ML 问 了 下 这 个 问题 了， 发 现在 From 空间 满 了 的 时 候 ， 曾 经 有 人 把 对 象 分 配 到 To 空 
间 过 。 但 是 如 今 已 经 没 人 这 么 做 了 ， 所 以 第 58 行 和 第 59 行 的 代码 现在 不 会 被 执行 。 

到 了 第 66 行 ，obj 就 已 经 复制 到 To 空间 或 老年 代 空 间 了 。 在 这 里 将 目标 空间 的 地 址 作 















































Q@ ML 上 的 问答 : http:Wgroups.google.com/group/rubinius-dev/browse thread/thread/da61f0efb9003bdb。 
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为 forwarding 指针 ， 设 定 给 原 空 间 的 对 象 。 
最 后 只 要 返回 目标 空间 的 地 址 ，saw_object() 就 结束 了 。 


12.5.7 (3) 搜索 复制 完毕 的 对 象 
下 面 搜索 复制 到 To 空间 和 老年 代 的 对 象 ， 反 复 复制 子 对 象 。 








vm/gc/baker.cpp:collect() 




















85 void BakerGC::collect(GCData& data) { 
101 promoted_ = new 0bjectArray(0); /* 已 晋升 对 象 的 动态 数组 */ 
/* (1) 搜索 从 记录 集 引 用 的 对 象 */ 
/* (2) 复制 从 根 引 用 的 对 象 */ 
180 promoted_current = promoted_insert = Promoted_->begin(); 
181 
182 while(promoted_->size() > 0 || !fully_scanned_p()) { 
183 if(promoted_->size() > 0) { 
184 for(;promoted_current != promoted._->end(); 
185 ++promoted_current) { 
186 tmp = *promoted_current; 
187 
188 scan_object (tmp); 
192 } 
193 
194 promoted_->resize(promoted_insert - promoted_->begin()); 
195 promoted_current = promoted_insert = promoted._->begin(); 
196 
197 } 
202 copy_unscanned(); 
203 } 
207 delete Promoted_; 
208 promoted_ = NULL; 
/* (4) 垃圾 对 象 的 后 处 理 */ 
232 } 








在 第 101 行 初始 化 的 promoted_( 晋 升 链表 ) 是 记录 已 晋升 的 对 象 的 动态 数组 ， 在 此 用 (1) 
和 (2) 的 操作 记录 已 晋升 的 对 象 。 
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第 180 行 用 于 初 始 化 promoted_current 和 promoted_inserto 它们 各 自 的 作用 如 下 所 示 o 


。promoted_current 指示 搜索 位 置 
。promoted_insert 指 示 保 存 着 指向 下 一 个 晋升 对 象 的 指针 的 场所 


i 内 容 为 前 提 ， 一 起 来 看 一 下 从 第 182 行 开 始 的 while 循环 吧 。 
这 个 while 循环 的 延续 条 件 是 “有 未 搜索 的 已 晋升 对 象 ”或 “To 空间 里 有 未 搜索 的 对 象 ”。 

也 就 是 说 ， 只 要 搜索 完 所 有 已 经 复制 的 对 象 ， 这 个 循环 就 停止 了 。 

第 184 行 和 第 185 行 的 for 循环 执行 的 操作 是 搜索 所 有 已 经 从 From 空间 晋升 的 对 象 。 
第 188 行 的 scan_object() 是 用 来 执行 搜索 的 。 

这 里 有 一 点 希望 大 家 注意 ， 那 就 是 子 对 象 有 可 能 会 在 搜索 对 象 的 过 程 中 晋升 。 事 实 上 此 
时 的 晋升 操作 是 很 复杂 的 。 

下 面 米 看 一 下 成 员 函 数 promoted_push(),， 它 负责 追加 那些 指向 已 晋升 到 promoted_ 的 
对 象 的 指针 。 









































vm/gc/baker.hpp 
84 void promoted_push(0bject* obj) { 
85 if(promoted_insert == promoted_current) { 
86 size_t i = promoted_insert - promoted._->begin(), 
87 j = promoted_current - Promoted_->begin() ; 
88 Promoted_->push_back(obj) ; 
89 promoted_current = promoted_->begin() + j; 
90 promoted_insert = promoted_->begin() + i; 
91 } else { 
92 *promoted_insert++ = obj; 
93 } 
94 了 








总 而 言 之 , 如 果 promoted_insert 和 promoted_current 指向 的 位 置 是 一 样 的 ,就 
往 promoted_ 里 新 追加 元 素 ; 如 果 不 是 ,就 在 promoted_insert 指 回 的 位 置 重 写 opj, 将 
promoted_insert 偏 移 到 下 一 个 位 置 。 因 为 promoted_ 内 的 那些 “搜索 完毕 ”的 元 素 已 经 不 会 
再 被 使 用 了 ， 所 以 不 管 将 其 重 写 还 是 释放 都 没有 关系 。 

也 就 是 说 ， 在 搜索 已 晋升 的 对 象 的 过 程 中 ,一旦 发 生子 对 象 晋 升 的 情况 ， 就 可 以 考虑 如 
图 12.30 所 示 的 两 种 操作 。 在 (1) 的 情况 下 ,程序 会 在 第 184 行 到 第 192 行 的 for 循环 内 搜 
索 对 象 ; 而 在 (2) 的 情况 下 ， 就 不 是 在 这 次 的 循环 内 搜索 对 象 ， 而 是 在 下 一 次 的 for 循环 内 
搜索 对 象 。 

在 第 194 行 通过 过 promoted_insert 的 位 置 重新 调整 动态 数组 的 大 小 , 在 第 195 行将 
promoted_insert 和 promoted_current 指 向 的 位 置 重合 ， 为 下 一 一 项 处 理 做 准备 。 

话说 回来 ， 为 什么 处 理会 变 得 这 么 复杂 呢 ? 原因 就 是 内 存 的 使 用 效率 。 
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(追加 到 末尾 的 案例 


promoted_current 
promoted_insert 


新 追加 





(2) 保存 到 promoted insert 所 指 元 素 内 的 案例 
重 写 搜索 完毕 的 元 素 


promoted 新 晋升 


promoted_insert promoted_current 





图 12.30 在 搜索 晋升 后 的 对 象 的 过 程 中 晋升 

















如 果 在 搜索 对 象 的 过 程 中 其 子 对 象 发 生 了 晋升 ， 倒 是 可 以 把 对 象 的 指针 追加 到 动态 数组 
的 末尾 ， 不 过 这 样 一 来 ， 就 变 成 了 晋升 和 搜索 的 死 循环 ， 可 能 会 造成 巨大 的 动态 数组 。 

因此 这 里 采用 了 男 一 种 手法 ， 就 是 重新 利用 那些 已 经 搜索 完毕 的 数组 元 素 。 

重新 回 到 代码 上 来 。 当 搜索 完 所 有 已 晋升 的 对 象 后 ， 接 下 来 就 在 第 202 行 调用 copy- 
unscanned() 函数 ， 搜 索 To 空间 里 未 搜索 的 对 象 。 

在 搜索 To 空间 的 对 象 的 过 程 中 ， 可 能 有 对 象 已 经 晋升 了 。 这 种 情况 下 while 循环 是 不 
会 结束 的 ， 要 从 头 来 过 。 像 这 样 ， 程 序 会 把 所 有 的 活动 对 象 复制 到 To 空间 或 老年 代 空 间 。 
此 外 ， 为 在 调用 copy_unscanned() 图 数 的 时 候 promoted_insert 和 promoted_current 指 
着 同一 个 位 置 ， 所 以 已 晋升 的 对 象 会 被 追加 到 promoted_ 的 末尾 。 


12.5.8 _ copy_unscanned() 


成 员 函 数 copy_unscanned() 负责 搜索 To 空间 里 那些 未 搜索 的 对 象 。 


























vm/gc/baker.cpp:collect() 


70 void BakerGC::copy_unscanned() { 

本 Object* iobj = next->next_unscanned(object_memory->state); 
72 

Y3 while(iobj) { 

75 if(!iobj->forwarded_p()) scan_object(iobj) ; 

Te iobj = next->next_unscanned(object_memory->state); 

77 } 

78 上 





大 家 看 一 下 函数 的 内 容 ， 应 该 没什么 难以 理解 的 地 方 吧 。 国 数 next_unscanned() 负责 
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返回 指向 下 一 个 未 搜索 对 象 的 指针 。 如 果 没 有 未 搜索 的 对 象 ， 那 么 函数 就 会 返回 NULL。 


12.5.9 ”Scan_objectO 


之 前 曾经 介绍 过 ，scan_object() 函数 负责 “复制 指定 对 象 的 子 对 象 "*， 实 际 上 其 代码 是 























怎样 的 呢 ? 
vm/gc/gc.cpp 
36 void GarbageCollector::scan_object(0bject* obj) { 
37 Object* slot; 
38 
43 if(obj->klass() && obj->klass()->reference_p()) { 
44 slot = saw_object(obj->klass()); 
45 if(slot) object_memory->set_class(obj, slot); 
46 了 
47 
48 if(obj->ivars() && obj->ivars()->reference_p()) { 
49 slot = saw_object(obj->ivars()); 
50 if(slot) obj->ivars(object_memory->state, slot); 
51 } 
64 TypelInfo* ti = object_memory->type_info[obj->type_id()] ; 
67 ObjectMark mark(this); 
68 ti->mark(obj, mark); 
69 小 








从 第 43 行 到 第 51 行 的 操作 是 复制 所 有 种 类 的 对 象 共同 的 子 对 象 。 

第 44 行 的 gass() 和 第 49 行 的 ivars() 分 别 是 和 成 员 函 数 klass_ 和 ivars_ 相对 应 的 
getter。 这 些 成 员 函 数 是 由 0bjectHeader 类 定义 的 。 因 为 所 有 对 象 类 都 继承 了 0bjectHeader 类 ， 
所 以 它们 是 所 有 对 象 共 同 的 成 员 变 量 ， 并 且 这 些 成 员 变 量 里 存 有 指向 对 象 的 指针 。 

首先 以 指向 此 对 象 的 指针 为 参数 调用 saw_object() 。 如 果 被 指定 为 参数 的 对 象 是 新 生 代 
对 象 ， 就 将 其 复制 到 To 空间 ， 返 回 目标 空间 的 地 址 。 如 果 对 象 是 老年 代 对 象 ， 就 不 进行 复制 ， 
直接 返回 参数 值 。 

接 下 来 复制 对 象 回 有 的 子 对 象 。 

在 第 64 行 取出 TypeInfo 类 的 实例 。 所 有 对 象 都 有 继承 了 Typelnfo 类 的 xX::Info 类 。 









































举 个 例子 ， Array 就 存在 Array: :Info 类 ， 这 里 就 是 取出 其 实例 。 

















在 第 67 行 生成 0bjectMark 类 的 实例 。 大 家 请 记 住 一 点 : 这 里 取 的 参数 是 this (GC 类 的 


实例 )。 


在 第 68 行 调用 mark() 。 
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vm/type_info.cpp 


64 void TypeInfo::mark(0bject* obj, ObjectMark& mark) { 
65 auto_mark(obj, mark); 
66 } 





其 中 调用 了 auto_mark()。auto_mark() 是 在 继承 的 各 个 XX: :Info 类 中 实现 的 成 员 函 数 。 
这 就 是 设计 模式 中 所 说 的 模板 方法 模式 。 
在 这 里 以 Array: :Info 为 例 来 看 一 下 操作 的 内 容 。 





vm/gen/typechecks.gen.cpp 


2711 | void Array::Info::auto_mark(0bject* _t, ObjectMark& mark) { 
2712 Array* target = as<Array>(_t); 
2713 
2714 { 
2715 if(target->total()->reference_p()) { 
2716 Object* res = mark.call(target->total()); 
2717 if(res) target->total(mark.gc->object_memory->state, (Fixnum*)res); 
2718 } 
2719 上 
/* 省 略 */ 
2741 | } 

















从 auto_mark() 这 个 函数 名 可 知 这 个 成 员 函 数 是 自动 生成 的 。 通 过 传输 Rubinius 的 C++ 
源 代 码 ， 抽 出 每 个 对 象 的 类 的 成 员 变 量 ， 就 生成 了 这 个 函数 的 源 代码 。 顺 便 一 提 ， 这 个 自动 
生成 操作 是 用 Ruby 写 的 。 

那么 来 看 看 内 容 。 第 2716 行 对 于 对 象 的 成 员 变 量 调用 了 mark.call()， 第 2717 行将 其 
返回 值 存 人 了 成 员 变量 中 。 











vm/gc/object_mark.cpp 





9 DbjectMark: :0bjectMark(GarbageCollector* gc) : gc(gc) {+} 
10 
bl Dbject* ObjectMark::call(Object* obj) { 
2 if(!obj->reference_p()) return NULL ; 
/* 省 略 (debug 处 理 ) */ 
20 return gc->saw_object(obj); 
21 } 























实际 上 只 是 调用 了 gc 的 saw_object() 而 已 。 请 大 家 回忆 一 下 ， 在 生成 objectMark 的 实 
例 时 已 经 把 GC 类 的 实例 给 出 去 了 ， 此 时 第 20 行 的 gc 里 存 有 BakerGc 类 的 实例 。 
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虽然 看 起 来 挺 绕 的 , 不 过 这 样 一 来 GC 类 的 抽象 程度 就 提高 了 。GC 类 里 不 仅 有 BakerGC 
还 有 ImmixGC 类 和 MarkSweepGC 类 。 这 些 类 中 都 各 自 实 现 了 saw_object() ， 在 其 中 执行 


ImmixGC 类 


类 固有 的 标记 处 理 。 





大 家 或 许 会 想 : 要 是 只 因为 这 点 小 事 的 话 ， 那 干脆 就 不 要 objectMark 类 了 吧 ? 不 过 这 


个 成 员 函 


数 cal1() 里 可 以 描述 所 有 GC 类 共同 的 处 理 。 这 次 的 源 代码 中 省 略 了 这 部 分 内 容 ， 








不 过 实际 上 debug 处 理 已 经 描述 在 cal10 函数 内 了 。 想 必 开 发 者 也 是 预见 了 今后 这 样 的 共 
同 处 理会 日 益 增 加 ， 才 如 此 设计 的 吧 。 


12.5.10 ” (4) 垃圾 对 象 的 后 处 理 
最 后 我 们 来 看 一 下 如 何 对 残留 在 From 空间 里 的 垃圾 对 象 执行 后 处 理 。 


vm/gc/baker.cpp:collect() 


85 
92 
93 
94 
95 


215 


232 





void BakerGC::collect(GCData& data) { 


Object* tmp; 


ObjectArray *current_rs = object_memory->remember_set; 


/* (1) 搜索 从 记录 集 引用 的 对 象 */ 











/* (2) 复制 从 根 引 用 的 对 象 */ 








/* (3) 搜索 复制 完毕 的 对 象 */ 


find_lost_souls() ; 


} 




















负责 执行 这 项 操作 的 函数 是 第 215 行 的 find_lost_souls() 浮 数 。 孙 数 名 的 意思 是 “ 找 
到 失落 的 灵魂 "， 很 符合 其 处 理 内 容 。 


vm/gc/baker.cpp 
268 void BakerGC::find_lost_souls() { 
269 Object* obj = current->first_object(); 
270 while(obj < current->current) { 
271 if(!obj->forwarded_p()) { 
272 delete_object (obj); 
277 
278 obj = next_object (obj); 
279 了 
280 了 
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find_lost_souls() 函数 被 用 于 执行 垃圾 对 象 的 后 处 理 ， 那 么 后 处 理 又 是 什么 呢 ? 

根据 对 象 的 种 类 不 同 ， 有 些 对 象 持 有 GC 对 象 范围 之 外 的 内 存 空 间 。 简 单 来 说 ， 这 些 空 
间 就 是 用 malloc() 等 分 配 的 VM Heap 范围 外 的 内 存 空间 。 因 为 这 些 内 存 空 间 并 没有 被 分 配 
到 From 空间 ， 所 以 自然 不 能 通过 GC 复制 算法 将 其 重新 利用 。 当 对 象 成 为 了 垃圾 时 ， 如 果 
不 明确 释放 内 存 的 话 ， 就 会 产生 内 存 泄露 。 

执行 释放 操作 的 函数 正 是 find_lost_souls() 函数 。 也 就 是 说 ， 在 这 里 我 们 将 位 于 GC 
对 象 范围 外 的 那些 不 能 再 次 利用 的 内 存 空 间 称 为 “失落 的 灵魂 "。 这 个 函数 负责 把 这 些 “ 灵 魂 ” 
从 内 存 中 释放 出 来 ， 让 其 “成 佛 ”。 

来 看 看 源 代码 吧 。 第 271 行 负责 调用 obj 的 forwarded_p()。 因 为 没有 forwarding 指针 ， 
说 明 这 个 对 象 没 有 被 复制 ， 所 以 计算 机 将 其 视 为 垃圾 对 象 。 

之 后 对 这 个 垃圾 对 象 调用 delete_object()。 虽 然 delete_object() 中 调用 的 是 每 个 对 
象 的 成 员 函 数 cleanup() ， 但 实现 了 这 个 函数 的 只 有 Regexp 类 和 Bignum 类 ， 除 此 之 外 的 类 
的 对 象 都 不 会 出 现 “ 失 落 的 灵魂 ”。 

这 里 先 来 看 一 下 Regex 类 的 cleanup() 吧 。 


















































vm/builtin/regexp.cpp 
29 void Regexp::Info::cleanup(0bject* regexp) { 


30 onig_free(as<Regexp> (regexp)->onig_data); 
31 as<Regexp> (regexp)->onig_data = NULL; 
32 


可 见 free() 已 经 被 执行 了 。 


12.6 


最 后 以 答疑 形式 来 复习 一 下 Rubinius 的 垃圾 回收 。 


12.6.1 ”该 在 何 时 启动 各 个 GC 算法 呢 ? 


当 用 于 GC 复制 算法 的 内 存 空间 已 满 ， 无 法 分 配对 象 时 ， 我 们 就 该 启动 GC 复制 算法 了 。 
这 是 因为 一 般 执行 分 配 时 用 的 是 新 生 代 GC 的 GC 复制 算法 的 分 配器 ， 它 跟 老 年 代 GC 的 CC 
标记 - 清除 算法 以 及 ImmixGC 不 同 ， 不 会 频繁 地 启动 CC 复制 算法 。 

ImmixGC 和 GC 标记 - 清除 算法 的 启动 时 机 是 相同 的 ， 那 就 是 用 于 GC 标记 - 清除 算法 的 
内 存 空 间 中 被 分 配 了 一 定 程 度 的 内 存量 时 。 现 在 分 配 1M 字 节 的 内 存量 ， 老 年 代 GC 就 会 启动 。 

此 外 ， 启 动 所 有 GC 的 时 机 如 下 所 示 。 















































。 在 Ruby 中 调用 了 GC.start() 时 
。 用 malloc() 和 realloc() 等 分 配 了 一 定 程度 的 量 时 
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12.6.2 “为 什么 把 执行 GC 复 制 算 法 的 类 叫 作 BakerGC2? 


在 源 代 码 中 出 现 了 一 个 叫 作 BakerGc 的 类 。 

这 个 BakerGc 大 概 指 的 是 Baker 的 GC 复制 算法 09， 但 是 从 这 篇 论文 的 内 容 来 看 ， 作 者 
是 通过 GC 复制 算法 来 实现 增 量 式 GC 的 ， 所 以 怎么 看 都 跟 实 现 的 内 容 不 符 。 

因此 ， 笔 者 对 Rubinius 的 开发 者 Evan 提出 了 下 列 问题 ?。 























然后 开发 者 给 出 了 如 下 答案 。 


我 或 许 应 该 给 它 起 名 叫 作 SemispaceGC。 
虽然 这 个 GC 里 用 到 了 Baker 的 “Semispace copy 算法 ”"， 不 过 这 个 算法 不 同 于 他 的 增 量 

















起 全 C。 
《中略 ) 
接 下 来 我 打算 修正 这 部 分 ， 为 了 明确 以 上 内 容 ， 大 概 会 更 改 这 个 类 名 。 











看 样子 Evan 在 实现 Rubinius 的 新 生 代 GC 时 ， 是 以 同一 论文 内 单纯 的 GC 复制 算法 (并 
非 增 量 式 GC ) 作为 参考 的 。 因 此 ， 才 会 有 BakerGc 这 个 名 字 。 

然而 ， 笔 者 认为 这 个 名 字 非 常 具有 迷惑 性 ， 因 为 一 提 到 Baker 的 GC 复制 算法 ， 人 们 
一 般 都 会 想到 增 量 式 GCC。 既然 开发 者 也 给 出 了 回答 ,那么 想必 BakerGc 这 个 名 字 也 快 从 
Rubinius 的 源 代 码 中 消失 了 吧 。 


12.6.3 ”为 什么 是 准确 式 GC? 
下 面 来 比较 一 下 保守 式 CC 和 准确 式 GC 两 者 的 优点 和 缺点 。 


表 12.7 保守 式 GC 和 准确 式 GC 











保守 式 GC mutator 不 用 在 意 GC 能 使 用 的 GC 算 法 有 限 
准确 式 GC GC 算 法 没有 限制 mutator 需 要 意识 到 GC 























保守 式 GC 在 mutator 内 (几乎 ) 不 用 在 意 GC 的 存在 ， 所 以 能 非常 轻松 地 生成 处 理 程序 。 
这 样 一 来 在 CRuby 中 就 能 简单 地 描述 C 语言 扩展 库 了 。 








GD ML 上 的 问答 : http://groups.google.com/group/rubinius-dev/browse_thread/thread/bec4cc945e9a01dd。 


12.6 Q&A 

















但 是 另 一 方面 ， 保 守 式 GC 有 着 诸多 限制 ， 例 如 不 能 实现 单纯 的 GC 复制 算法 等 。 因 此 
可 以 说 保守 式 GC 位 于 一 个 很 难 改良 GC 本 里 的 环境 里 。 

而 准确 式 GC 则 需要 在 mutator 内 考虑 到 GC。 但 因为 准确 式 GC 在 GC 算法 上 没有 限制 ， 
所 以 我 们 可 以 较为 简单 地 改良 GC， 也 可 以 简单 地 实现 GC 复制 算法 。 


Rubinius 之 所 以 采用 这 个 准确 式 GC， 就 是 因为 觉得 准确 式 GC 编写 起 来 更 容易 吧 。 
此 外 ，Rubinius 有 个 理念 ， 就 是 “用 Ruby 制作 Ruby 处 理 程序 ”，， 另 外 还 有 一 个 想法 就 


是 “反正 几乎 所 有 代码 都 在 Rubinius 的 处 理 程序 内 运作 ， 选 用 准确 式 GC 更 合适 一 些 ”。 


12.6.4 “不 解释 一 下 如 何 实现 ImmixGC 吗 ? 
笔者 一 开始 是 打算 在 本 书 中 解释 如 何 实 























现 ImmixGC 的 ， 但 因为 以 下 原因 而 放弃 了 。 
。JImmixGC 是 最 近 才 实现 的 ， 今 后 可 能 会 有 较 大 的 变动 

。 还 有 没 实现 的 地 方 

。 篇 幅 所 限 





会 觉得 很 有 意 
思 的 。 因 为 本 章 中 也 涉及 了 GC 类 的 设计 部 分 ， 所 以 大 家 没 法 一 口气 读 下 去 ， 不 过 应 该 多 少 
还 是 能 读 懂 的 。 





ImmixGcC 的 源 代码 存在 /vm/gc/immix.cpp 中 。 


12.6.5 “为 什么 要 把 老年 代 对 象 存 储 在 记录 集 里 呢 ? 


请 大 家 回忆 一 下 Rubinius 的 写 入 屏障 。 当 从 老年 代 空 间 内 的 对 象 引用 新 生 代 空间 内 的 对 
象 时 ， 指 向 老年 代 对 象 的 指针 被 存 人 了 记录 集中 。 








记录 集 


新 生 代 空 间 





老年 代 空 间 


From 空间 

















图 12.31 Rubinius 的 写 入 屏障 
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大 家 是 不 是 觉得 有 些 奇 怪 呢 ? 这 样 一 来 ,我们 就 没 法 马上 看 出 老年 代 对 象 内 的 哪个 成 员 
变量 持 有 指向 新 生 代 的 引用 了 。 单 纯 来 想 的 话 ， 把 新 生 代 对 象 存储 在 记录 集 里 似乎 更 合适 一 些 。 
不 过 这 是 有 着 正当 理由 的 。 











(1) 当 记录 老年 代 对 象 时 








新 生 代 空间 老年 代 空间 新 生 代 空 间 


From 空 间 









O) 当 记 录 新 生 代 对 象 时 

















新 生 代 空 间 


From 空 间 








V 





复 钵 


I 





图 12.32 复制 到 To 空间 




















Rubinius 的 新 生 代 GC 是 GC 复制 算法 。 在 记录 集 里 记录 了 新 生 代 对 象 的 情况 下 ， 虽 说 
可 以 把 新 生 代 对 象 复制 到 To 空间 ,但 这 样 就 没 办 法 把 目标 空间 的 地 址 传达 给 老年 代 对 象 了 。 
因为 不 可 能 从 引用 的 目标 去 查找 引用 的 起 点 。 

如 果 记 录 集 里 记录 的 是 老年 代 对 象 ， 就 可 以 用 目标 空间 的 地 址 来 重 写成 员 变 量 的 内 容 。 
是 因为 记录 集 已 知 老年 代 对 象 的 地 址 。 

不 过 ， 当 记录 集 里 记录 了 老年 代 对 象 时 ， 在 执行 GC 时 就 必须 搜索 一 次 全 体 对 象 。 因 为 
对 象 的 子 对 象 中 也 可 能 挨 杂 着 老年 代 对 象 ， 所 以 需要 为 此 付出 相应 的 时 间 和 精力 。 当 新 生 代 
GC 的 算法 不 是 像 GC 复制 算法 这 样 移动 对 象 的 算法 时 ， 往 记录 集 里 记录 新 生 代 对 象 会 更 节 
省 搜索 时 间 ， 更 有 效率 。 

















[Es 























LE 末 关 本 章 前 言 


在 开始 讲解 V8 之 前 ， 先 为 大 家 介绍 一 下 V8 诞生 的 背景 吧 。 不 知 各 位 是 和 否 知道 Coogle Chrome 
这 个 Web 浏览 器 呢 ? 








13.1.1 ”什么 是 Google Chrome 


Google Chrome 是 由 Google 公司 开发 的 一 款 Web 浏览 器 。 这 款 软件 于 2008 年 12 月 发 布 ， 如 
今 (2009 年 10 月 ) 已 经 占据 浏览 器 市 场 将 近 3952 的 份额 ， 作 为 浏览 器 大 成 ”的 新 兴 势 力 而 备 受 瞩目 。 

虽然 Google Chrome 也 可 以 简称 为 CC， 不 过 因为 太 容易 跟 垃圾 回收 弄 混 了 ， 所 以 之 后 就 
将 其 简称 为 Chrome。 














Q@ Chrome: 倡 语 的 意思 是 “窗户 ”。 
@ W3counter: http://www.w3counter.com/globalstats.php。 
@) 浏览 器 大 战 : Web 浏 览 器 的 市 场 份额 争夺 战 。 现 在 是 第 二 次 浏览 器 大 战 ( 也 就 是 说 有 第 一 
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Chrome 正式 匹配 的 OS 如 今 只 有 Windows， 不 过 在 2009 年 6 月 官方 也 发 布 了 Linux 和 
MacOS 的 预览 版 本 。 

Chrome 自身 不 是 开源 的 ， 不 过 有 一 个 叫 作 Chromium 的 开源 项 目 ， 它 是 Chrome 的 基础 。 
基础 为 开源 项 目 ， 这 也 是 Chrome 的 一 大 卖点 。 


13.1.2 ”什么 是 V8 


Chrome 最 大 的 特点 就 是 搭载 了 Google 公司 独立 开发 的 高 速 JavaScript 引擎 (语言 处 理 程 
序 )。 这 个 JavaScript 引擎 就 是 本 章 中 要 解说 的 V8。 
V8 的 正式 名 称 是 “V8 JavaSceript Engine( 引 擎 六 ， 本 书 中 简称 为 V8。 
V8 是 Google 公司 为 Chrome 创建 的 开源 JavaScript 语言 处 理 程序 (VM)。 项 目 有 20 位 核 
心 成 员 ， 他 们 几乎 都 是 Google 公司 的 工程 师 。V8 项 目的 主要 开发 者 是 Lars Bak (Google 公司 
只 员 )， 他 曾 参 与 过 SelfVMS 、 Strongtalk® 、HotspotVM (JVM ) 的 开发 。 
V8 的 特征 如 下 所 示 。 


































































































。 采 用 JIT( 即 时 编译 ) 的 方式 
。 使 用 了 以 Strongtalk 和 SelfyYM 栽培 的 技术 

















传统 的 解释 方式 是 用 解释 器 解释 JavaScript 代码 ， 在 VM 中 进行 处 理 。JavaScript 引擎 以 
往 都 是 以 这 种 解释 方式 实现 的 。 而 JIT (Just-In-Time ) 的 编译 方式 则 是 在 执行 源 代码 时 将 其 变 
换 成 机 器 代码 ， 从 而 高 速 执行 处 理 。 因 为 使 用 JIT 编译 方式 能 够 直接 执行 已 编译 的 机 器 代码 ， 
所 以 能 实现 高 速 处 理 。 

此 外 ，V8 从 Strongtalk 和 SelfVM 这 些 与 Lars 有 关 的 处 理 程序 中 汲取 了 很 多 长 人 处。 


@@ 


V8 的 名 称 的 来 历 

V8 这 个 名 字 来 源 于 汽车 的 “V 型 8 缸 发 动机 ”(V8 发 动机 )。V 型 8 缸 发 动机 主要 是 在 美国 
发 展 起 来 的 ， 因 为 其 马力 十 足 而 广为人知 。 也 就 是 说 开发 者 想 告 诉 我 们 ，V8 是 “强力 且 高 速 的 
JavaScript 引擎 。 

一 提 到 美国 车 ， 大 家 普遍 都 会 想到 它 稻 隆隆 的 低沉 排 气 声 以 及 其 强劲 的 速度 ， 但 另 一 方面 大 
家 也 都 知道 它 “ 费 油 ”。 关 于 这 一 点 ，Google 公司 表示 V8 的 垃圾 回收 是 “高 效 的 垃圾 回收 ”。 在 
PC 平台 上 ，V8 引擎 的 效率 很 高 。 























































































































GD Chromium: http://code.google.com/chromium/。 
@ Self: 以 原型 为 概念 的 面向 对 象 语言 ， 它 给 JavaScript 的 设计 带 来 了 影响 。 
@@) Strongtalk: Smalltalk 处 理 程 序 。 因 与 SelfVM 的 技术 搭配 起 来 性 能 非常 优异 而 著名 。 














13.1.3 ”获取 源 代码 


本 书 中 采用 了 写作 本 书 时 (2009 年 10 月 1 日 ) 最 新 的 版 本 1.3.13.5。 
V8 的 源 代码 托管 在 GoogleCode® Es 
http://code.google.com/p/v8/ 





Project Home Downloads Wiki Issues Source 


Summary | Updates | People 
V8 JavaScript Engine 


V8 is Google's open source JavaScript engine. 
V8 is written in C++ and is used in Google Chrome, the open source browser from Google. 


V8 implements ECMAScript as specified in ECMA-262, 3rd edition, and runs on Windows 
XP and Vista, Mac OS X 10.5 (Leopard), and Linux systems that use IA-32 or ARM 
processors. 





V8 can run standalone, or can be embedded into any C++ application. 
You can find more information here: 


es The V8 documentation front page. 

se。 Performance documentation covering the performance goals of V8, and 
instructions on how to run the V8 benchmark suite. 

es。 User mailing list: http://groups.google.com/group/v8-users 

se。 The V8 contributor wiki page. 








v8 
€or V8 JavaScript Engine | 








13.1 V8 项 目 ( GoogleCode ) 
大 家 可 以 使 用 下 面 的 命令 来 检测 源 代 码 。 


$ svn checkout http://v8.googlecode.com/svn/tags/1.3.13.5/ 


13.1.4 源 代码 结构 
V8 的 目录 结构 如 下 所 示 。 
表 13.1 目录 结构 


benchmarks JavaScript 的 基准 测试 文件 群 





include 定义 外 部 公开 函数 的 头 文件 群 








samples 示例 代码 群 ( 利 用 V8 生成 的 HTTP 服 务 和 shell 等 ) 

















sre V8 源 代码 





V8 的 测试 

















工具 群 




















GD GoogleCode: 由 Google 运 营 的 免费 项 目 托管 服务 。 
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本 童 中 要 解说 的 只 有 其 中 的 “sre” 目录 。 
V8 由 约 14 万 行 源 代码 构成 。 因 为 JavaScript 不 存在 标准 库 ， 所 以 相 比 之 前 为 大 家 说 明 
的 处 理 程序 来 说 ，V8 的 行 数 相当 少 。 


表 13.2 源 代码 分 布 
源 代码 行 数 
116 883 





JavaScript 12 630 
C 9 893 

















如 表 13.2 所 示 ，V8 的 源 代码 几乎 都 是 用 C++ 写 的 。 


下 部 们 V8 的 GC 算法 
V8 实现 了 准确 式 GC，GC 算法 方面 采用 了 分 代 垃 圾 回收 ,分 代 垃 圾 回收 的 结构 如 下 表 所 示 。 
表 13.3 分 代 垃 圾 回收 的 结构 


新 生 代 GC CC 复制 算法 ( Cheney 的 CC 复制 算法 ) 
老年 代 GC GC 标记 -清除 算法 、GC 标 记 - 压 缩 算法 

















由 表 13.3 可 知 ， 这 里 的 分 代 垃 圾 回收 和 第 12 章 中 介绍 的 垃圾 回收 结构 相似 。 本 书 ( 第 
11 章 和 第 12 章 ) 中 已 经 讲 过 GC 复制 算法 和 GC 标记 - 清除 算法 的 实现 了 ， 因 此 本 章 将 对 老 
年 代 GC 的 其 中 一 项 一 一 GC 标记 - 压缩 算法 进行 说 明 。 

Google 公司 将 V8 的 垃圾 回收 称 为 “高 效 的 垃圾 回收 ”"， 其 原因 V8 不 但 实现 了 准确 式 
GC， 而 且 实现 了 分 代 垃 圾 回收 。 就 笔者 所 知 ， 除 了 V8 之 外 ， 其 他 JavaScript 引 警 都 没有 搭 
载 像 分 代 垃 圾 回收 这 样 复 杂 的 GC。 


上 系 届 对 象 管理 


首先 从 数据 结构 开始 看 吧 。 


13.3.1 ” 持 有 不 同 分 配器 的 两 种 类 
V8 具有 以 下 两 种 类 ， 它 们 分 别 包含 不 同 的 分 配器 。 
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。Malloced 类 


。0bject 类 
在 V8 中 ， 几 乎 所 有 的 类 都 继承 了 上 述 类 中 的 一 个 。 


13.3.2 ”Malloced 类 
顾名思义 ，Malloced 类 使 用 malloc() 生成 实例 。 反 过 来 销毁 实例 时 则 使 用 free()。 


src/allocation.cc 


36 | void* Malloced: :New(size_t size) { 

38 void* result = malloc(size); 

39 if (result == NULL) V8: :FatalProcessOut0fMemory("Malloced operator new'"); 
40 return result; 

41|} 

42 
43 
44 | void Malloced: :Delete(void* p) { 
45 free(p) ; 

46 |} 





生成 实例 时 调用 成 员 函 数 New()， 销 毁 实 例 时 调用 成 员 函 数 Delete()。 大 家 也 知道 ， 各 
个 函数 内 已 经 调用 了 malloc() 和 free()。 


13.3.3 ” Object 类 


object 类 是 Javascript 的 对 象 的 具体 表现 。Javascript 的 对 象 种 类 繁多 ,它们 是 以 继承 
0bject 类 的 子 对 象 的 形式 表现 出 来 的 。 
object 类 的 继承 关系 如 图 13.2 所 示 。 


Ne 
JSValue JsRegExp | .. 


图 13.2 Object 类 的 继承 关系 
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0bject 类 的 子 对 象 的 分 配方 法 各 有 不 同 。 

图 13.2 中 的 Smi (Small integer ) 类 和 Failure 类 是 第 12 间 中 介绍 过 的 “内 般 对 象 ”。 也 就 
是 说 ,它们 是 没有 被 分 配 到 VM Heap 的 直接 数据 。 

生成 实例 时 会 把 图 13.2 中 的 Heap0bject 类 从 VM Heap 分 配 出 去 。 也 就 是 说 ， 
Heap0bject 类 的 实例 是 GC 的 对 象 。 因 此 ， 我 们 没 必 要 明确 地 销毁 实例 。Heapobject 类 是 用 
于 生成 GC 对 象 ， 也 就 是 实例 的 ， 所 以 可 以 说 是 本 章 中 最 为 重要 的 类 。 

HeapObject 类 实例 (对 象 ) 必定 存 有 指向 Map 类 实例 (map 对 象 ) 的 指针 。 本 章 中 将 其 称 为 
“map 地 址 ”。 这 个 Map 类 负责 管理 对 象 的 型 信息 ， 例 如 保留 实例 的 大 小 和 型 的 种 类 等 。Map 
这 个 名 字 来 源 于 SelfVM。 
























































Src/objects.h 
1142 | class Heap0bject: public Object { 
1143 | public: 
1144| // 到 Map 的 访问 咒 
1146 inline Map* map() ; 


1147 inline void set_map(Map* value) ; 
1300 | }; 


2689 | class Map: public HeapObject { 
2690 | public: 

2691| // 实例 (对 象 ) 的 大 小 

2692 inline int instance_size() ; 


2693 inline void set_instance_size(int Value) ; 


2703 | // 实例 (对 象 ) 的 类 
2704 inline InstanceType instance_type() ; 


2705 inline void set_instance_type(InstanceType Value) ; 





2913 | }; 











此 外 ， 对 象 是 按 4 字 节 或 8 字 节 (取决 于 CPU ) 对齐 的 ， 因 此 指向 对 象 的 指针 是 4 的 倍数 。 

在 继承 了 Heap0bject() 类 的 类 中 ,通常 不 能 使 用 new 和 delete 等 运算 符 。 
Heap: :Allocate() 函数 用 于 生成 实例 ， 关 于 这 个 函数 我 们 会 在 之 后 说 明 。 也 就 是 说 ， 在 这 里 
不 使 用 C++ 的 构造 函数 ， 而 是 通过 自身 的 分 配 絮 来 生成 实例 。 

为 什么 会 这 样 设 计 呢 ? 这 是 因为 C++ 的 构造 函数 基本 上 都 是 从 本 地 堆 分 配 内 存 的 。 由 于 必须 
从 VM Heap 分 配 作为 GC 对 象 的 对 象 ， 因 此 才 会 使 用 VM Heap 的 分 配 需 
函数 来 生成 实例 。 


















































Heap: :Allocate() 
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13.3.4 “其 他 特殊 的 类 


AllStatic 类 是 一 个 特殊 的 类 ， 意 思 是 “只 持 有 静态 信息 的 类 ”。 在 继承 了 Allstatic 类 的 
类 中 定义 了 全 局 变量 及 其 访问 器 、 静 态 的 (static ) 成 员 函 数 等 。 当 想 把 全 局 变量 和 函数 总 结 到 
一 个 命名 空间 时 ， 就 继承 Allstatic 类 。 因 此 ,继承 了 Allstatic 类 的 类 不 能 生成 实例 。 


13.3.5 VM Heap 
下 面 来 说 明 一 下 V8 的 VM Heap 的 结构 吧 。 首 先 把 之 前 在 13.3.3 节 中 讲 过 的 Heapobject 
类 (或 子 类 ) 的 实例 分 配给 VM Heap。 
VM Heap 内 的 内 存 空 间 由 以 下 两 部 分 组 成 。 








。 新 生 代 空间 

。 老 年 代 空 间 

另外 ， 新 生 代 空 间 还 被 分 成 了 用 于 GC 复制 算法 的 两 部 分 内 存 空 间 ， 即 “From 空间 ”和 
“To 空间 ”。 被 分 配 到 这 个 “From 空间 ” 里 的 对 象 会 成 为 GC 复制 算法 的 对 象 。 
老年 代 空 间 的 内 容 很 复杂 ， 这 里 我 们 将 其 总 结 一 下 ， 如 表 13.4 所 示 。 





表 13.4 老年 代 内 的 内 存 空间 
内 存 空间 名 分 配 到 空间 内 的 对 和 象 的 种 类 
老年 代 指 针 空间 可 能 引用 新 生 代 空间 的 对 象 
老年 代数 据 空间 不 具备 指针 的 字符 串 等 数据 对 象 




















机 器 代码 空间 jJIT 生 成 的 机 器 代码 











Map 空 间 对 象 的 型 信息 
Cell 空间 内 置 类 、 方 法 等 (JavaSeript 中 的 Array 类 等 ) 
大 型 对 象 空间 于 等 于 8K 字 节 的 大 对 象 ( 从 0S 直接 分 配 ) 




















表 13.4 中 介绍 的 内 存 空 间 都 有 各 自 的 标识 符 ， 具 体 如 下 所 示 。 


src/globals.h 























256 | enum AllocationSpace { 

257| NEW_SPACE, // 用 于 Gc 复制 算法 的 内 存 空间 (新 生 代 空 间 ) 
258 | OLD_POINTER_SPACE, // 老年 代 指针 空间 
259| OLD_DATA_SPACE, // 老年 代数 据 空间 
260| CODE_SPACE, // 机 还 代码 空间 
261| MAP_SPACE, // Map 空间 

262| CELL_SPACE, // Cell 空 间 

263| LO_SPACE, // 大 型 对 象 空间 
264 

265| FIRST_SPACE = NEW_SPACE, 

266| LAST_SPACE = LO_SPACE 

267 | }; 
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VM Heap 的 结构 如 图 13.3 所 示 。 


VM Heap 
新 生 代 空 间 老年 代 空 间 
用 于 GC 复制 算法 的 内 存 空间 


From 空间 




















新 生 代 指 针 空 间 
新 生 代 数据 空间 
机 器 代码 空间 




















To 空间 























Cell 空间 








Map 空间 














大 型 对 象 空间 








13.3 V8 的 VM Heap 结构 








此 外 ,管理 各 个 内 存 空间 的 实例 被 定义 为 了 Heap 类 的 类 变量 。 





Src/heap.cc 























55 | NewSpace Heap::new_space_; // 用 于 Gc 复 制 算法 的 内 存 空间 (新 生 代 空间 ) 
56 | 01dSpace* Heap::old_pointer_space_ = NULL; // 老年 代 指 针 空 间 

57 | 0ldSpace* Heap::old_data_space_ = NULL; // 老年 代数 据 空间 

58 | 0ldSpace* Heap::code_space_ = NULL; // 机 器 代码 空间 

59 | MapSpace* Heap::map_space_ = NULL; // Map 空 间 

60 | CellSpace* Heap::cell_space_ = NULL; // cel1 空 间 

61 | Large0bjectSpace* Heap::1o_space_ = NULL; // 大 型 对 象 空间 





NewSpace 类 和 01dSpace 类 负 责 管 理 上 述 源 代 码 内 的 内 存 空 间 ， 它 们 的 继承 关系 如 图 
13.4 所 示 。 
图 13.4 中 出 现 的 各 个 类 的 概要 如 下 所 示 。 


























。 Space 抽象 类 ， 为 各 个 内 存 空间 类 的 父 类 

。PagedSpace 拥有 8 区 字 节 的 多 个 页 面 

。 NewSpace 拥有 大 小 相同 的 两 个 内 存 空间 ( From 空间 和 To 空间 ) 
。 Large0bjectSpace 当 mutator 发 出 申请 时 ， 直 接 从 OS 获取 内 存 
。 FixedSpace 只 分 配 固定 大 小 的 对 象 

。 0ldSpace 分 配 可 变 大 小 的 对 象 

。 MapSpace 用 于 Map 空间 





CellSpace 用 于 Cell 空间 
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Malloced 
PagedSpace NewSpace LargeObjectSpace 

















MapSpace CellSpace 


图 13.4 各 个 内 存 空间 类 的 继承 关系 





本 章 中 将 对 上 述 项 目 中 的 老年 代 指 针 空 间 (0ldspace 类 ) 进行 说 明 。 


13.3.6 ”老年 代 指 针 空 间 的 结构 

老年 代 指 针 空 间 (01dSpace) 里 存 有 以 8K 字 节 对 齐 的 多 个 页 面 Page 类 的 实例 ) 作 为 内 存 
空间 。 这 些 内 存 空 间 里 的 多 个 页 面 分 别 用 单 向 链表 连接 (页 面 链表 )。01dspace 的 分 配器 负责 
往 这 些 页 面 内 分 配对 象 。 也 就 是 说 ， 页 面 才 是 老年 代 指 针 空 间 的 实体 。 














Src/spaces.h 


750 | class PagedSpace : public Space { 


868 | protected: 





/* 开头 页 面 */ 
876 Page* first_page_; 




















/* 结尾 页 面 


* 


VA 
880 Page* Last_page_; 








0ldSpace 类 的 父 类 PagedSpace 类 中 已 经 定义 了 成 员 变 量 first_page_ 和 成 员 变量 last_ 
page_o 成 员 变 量 first_page_ 里 存 有 页 面 链表 开头 页 面 的 地 址 ， 成 员 变量 last_page_ 里 存 有 
页 面 链 表 结 尾 页 面 的 地 址 。 
老年 代 指 针 空间 和 页 面 的 关系 如 图 13.5 所 示 。 
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Page 

OldSpace 

8K 字 节 
first page_ 
last page_ 

8K 字 节 

内 存 空间 的 实体 
8K 字 节 








图 13.5 老年 代 指 针 空间 的 页 面 链表 


因为 页 面 内 已 经 事先 被 分 配 了 下 一 个 页 面 的 地 址 和 用 于 记录 集 的 header， 所 以 可 用 的 页 
面 大 小 要 小 于 8K 字 节 。 
此 外 ， 如 果 想 从 对 象 的 地 址 找到 存 有 这 个 对 象 的 页 面 ， 就 要 利用 页 面 是 以 8K 字 节 对 齐 
的 这 个 条 件 。 关 于 这 个 搜索 方法 我 们 已 经 在 10.6.20 节 中 详细 说 明 过 了 ， 因 此 这 里 就 不 再 歼 


述 了 。 








13.3.7 ”对 象 分 配器 


Heap 类 中 实现 了 对 象 的 分 配 回 。Heap 类 是 继承 了 Allstatic 类 的 类 。 也 就 是 说 ,不 能 
生成 Heap 类 的 实例 。 


src/heap.h 


227 


281 
282 
283 
284 
285 
286 
287 


906 
907 
908 
909 
910 





class Heap : 




















public AllStatic { 


/* 到 VM Heap 内 的 各 个 内 存 空 间 的 访问 器 */ 


Static 
Static 
static 
static 
static 
static 


static 


NewSpace* 
0ldSpace* 
0ldSpace* 
0ldSpace* 
MapSpace* 


new_space() { return &new_space_; 上 
old_pointer_space() { return old_pointer_space_; } 
old_data_space() { return old_data_space_; } 
code_space() { return code_space_; } 


map_space() { return map_space_; 上 


CellSpace* cell_space() { return cell_space_; } 


Large0bjectSpace* lo_space() { return 1o_space_; } 


/* VM Heap 内 的 各 个 内 存 空间 */ 


static 
static 
static 
static 


static 


NewSpace new_space_; 


0ldSpace* 
0ldSpace* 
0ldSpace* 
MapSpace* 


old_pointer_space.; 
old_data_space.; 
code_space_; 


map_space_; 
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911 static CellSpace* cel1_space_; 
912 static Large0bjectSpace+k 1o_space_; 


44 
Heap 类 管理 着 VM Heap 内 的 各 个 内 存 空间 ， 分 配器 就 将 对 象 分 配 到 这 些 内 存 空 间 中 的 
某 一 个 。 
分 配对 象 的 函数 如 下 所 示 。 





Src/heap.cc 


1975 | Object* Heap::Allocate(Map* map, AllocationSpace Space) { 


1978 Dbject* result = AllocateRaw (map->instance_size(), 

1979 space, 

1980 TargetSpaceId(map->instance_type())); 
1981 if (result->IsFailure()) return result; 


1982 HeapObject::cast(result)->set_map (map) ; 
1983 return result; 
1984 | 上 




















第 1 个 参数 map 是 型 信息 。 在 这 里 把 内 存 空间 的 标识 符 传 递 给 第 2 个 参数 space， 比 如 
用 enum 定义 的 NEW_SPACE 这 样 的 值 ( 参 考 13.3.5 节 )。Allocate() 负责 往 space 指定 的 内 存 
空间 里 分 配对 象 。 

第 1978 行 调用 的 成 员 函 数 AlllocateRaw() 是 分 配 的 实体 。 函 数 名 内 的 Raw 有 着 “未 加 
工 的 、 生 的 ”的 意思 。A11llocateRaw() 根据 指定 的 space 调用 各 个 Space 类 的 分 配 回 ， 从 各 
个 内 存 空间 分 配 尚 未 初始 化 的 内 存 空间 (未 加 工 的 内 存 空间 )。 

当 作 为 分 配对 象 的 对 象 有 可 能 引用 新 生 代 时 ， 第 1980 行 的 成 员 函 数 TargetSpaceId() 
会 返回 0LD_POINTER_SPACE， 否 则 就 返回 0LD_DATA_SPACE。 通 过 这 个 返回 值 可 判断 这 个 空间 
是 老年 代 指 针 空 间 还 是 老年 代数 据 空间 。 

第 1981 行 负 责 在 AlllocateRaw() 失败 时 返回 result。 实 际 的 错误 处 理 是 由 成 员 函 数 
Alllocate() 的 mutator 负责 的 。 

第 1982 行 负 责 给 分 配 的 对 象 ee 昌 。 

最 后 一 步 是 把 已 分 配 的 对 象 返回 给 mutator。 


上 上 元 笛 通 往 准 确 式 6C 之 路 ( V8 篇 ) 


跟 Rubinius 一 样 ，V8 也 为 准确 式 GC 下 了 一 番 功 夫 。 在 此 介绍 一 下 几 个 具有 代表 性 的 
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。 HandleScope 
。 打 标签 
。 控 制 对 象 内 的 域 


13.4.1 _ HandleScope 

V8 不 能 基于 调用 栈 那 样 不 明确 的 根来 执行 GCC， 它 需要 基于 正确 的 根 ( 只 汇集 了 指向 对 
象 的 指针 的 根 ) 来 执行 GC。 在 生成 这 个 正确 的 根 时 ，HandleScope 就 派 上 大 用 场 了 。 

HandleScope 负责 管理 那些 指向 本 地 (C++ 的 ) 调 用 栈 中 的 对 象 的 指针 。HandleScope 有 





Handler 的 链表 ， 其 中 存 有 指向 对 象 的 指针 。 


当 V8 把 指向 对 象 的 指针 存 和 人 调用 栈 时 ,也 一 定 会 把 这 些 指 针 存 入 HandleScope 内 的 
handler 中 。 因 此 ， 指 向 调用 栈 中 的 对 象 的 所 有 指针 都 会 聚集 在 HandleScope 里 。GC 将 此 


HandleScope 内 的 指针 作为 根 的 一 部 分 。 








关于 这 一 点 ， 大 家 直接 看 代码 可 能 理解 起 来 更 快 一 些 ， 下 面 是 实际 使 用 了 HandleScope 





的 VM 内 的 代码 。 


Src/objects.cc 
196 | Object* 0bject: :GetPropertyWithDefinedGetter(0bject# receiver, 
197 JSFunction* getter) { 
198 HandleScope scope; 
199 Handle<JSFunction> fun(JSFunction::cast(getter)); 
200 Handle<0bject> self(receiver); 


207 bool has_pending_exception; 
208 Handle<0bject> result = 





209 Execution::Call(fun, self, 0, NULL, &has_pending_exception); 
211 if (has_pending_exception) return Failure::Exception(); 

Ep 3 return *result; 

213 | 上 


成 员 函 数 GetPropertyWithDefinedGetter() 负责 从 第 1 个 参数 的 对 象 中 取出 
过 在 这 里 重要 的 不 是 操作 本 身 的 内 容 ， 而 是 HandleScope 的 用 法 。 




















属性 值 。 不 


在 第 198 行 定 义 HandleScope 类 的 局 部 变量 (scope)。 然 后 在 第 199 行 和 第 200 行 定义 
Handle 类 的 局 部 变量 (fun 和 self)。 像 这 样 ， 在 使 用 指向 对 象 的 指针 时 ， 为 了 不 让 对 象 被 回 
收 挤 ， 就 需要 以 指针 为 参数 生成 Handle 类 。 而 且 在 生成 这 个 Handle 类 的 时 候 ， 需 要 把 指向 








对 象 的 指针 存在 HandleScope 内 。 


GetPropertyWithDefinedGetter() 内 的 调用 帧 和 HandleScope 的 状态 如 图 13.6 所 示 。 








13.4 ” 通 往 准确 式 GC 之 路 (V8 篇 ) 


























由 图 13.6 可 知 ， 在 bool 这 样 的 非 指针 和 指针 同 在 的 调用 帧 中 ， 只 有 指针 被 聚集 到 了 
HandleScope 内 的 HandlerList 中 。 这 是 因为 GC 是 把 这 个 HandleScope 当成 正确 的 根来 使 用 的 。 














调用 帧 


Handle result 














bool has_pending_exception 






































Handle self 
Handle fun 
HandleScope scope VM Heap 
-| =~| ”对 象 
-| ~| “对象 
>| “对象 




















HandlerList 

















13.6 ”调用 帧 和 HandleScope 








这 里 希望 大 家 注意 的 是 ，HandleScope 是 定义 在 调用 帧 内 的 。 也 就 是 说 ， 当 调用 完 函 数 
销毁 调用 帧 时 ，HandleScope 也 会 一 并 被 销毁 。 因 此 就 算 语言 处 理 程序 的 实现 者 不 去 理会 ， 
HandleScope 也 会 自动 被 销毁 。 


13.4.2 ”HandleScope 的 有 效 范 围 


那么 定义 的 HandleScope 能 管理 多 大 范围 的 handler 呢 ? 
举 个 例子 ，C++ 有 A 函数 和 了 函数 这 两 个 函数 ， 假 设 A 函数 能 调用 B 函数 。 














( 只 给 A 函数 定义 HandleScope (2) 给 A 函数 和 B 函数 都 定义 HandleScope 





HandleScope HandleScope 





B 函 数 内 的 handler 群 
B 函数 内 的 handler 群 












































A 函 数 内 的 handler 和 群 








HandleScope 








A 函数 内 的 handler 群 














图 13.7 HandleScope 的 范围 





如 果 只 给 A 函数 定义 了 HandleScope, 而 没有 给 B 函数 定义 HandleScope 的 话 ， 那 么 在 B 
函数 内 已 经 handle 的 那些 指向 对 象 的 指针 就 会 被 存 人 A 函数 内 的 HandleScope (图 13.7(1))。 
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这 样 的 情况 在 V8 中 很 常见 。 当 B 函数 的 对 象 使 用 量 较 少时 ， 考虑 到 生成 HandleScope 
所 需要 的 消耗 ， 就 不 给 B 函数 定义 HandleScope 了 。 

接 下 来 ， 假 设 已 经 给 A 函数 和 了 B 函数 分 别 定 义 了 HandleScope， 此 时 B 函数 作用 的 指针 
保存 在 B 函数 内 的 HandleScope 里 (图 13.7(2) )。 

也 就 是 说 ，HandleScope 的 有 效 范 围 是 "从 定义 这 个 HandleScope 后 到 定义 下 一 个 
HandleScope 之 前 ”， 还 可 以 说 成 “从 销毁 下 一 个 HandleScope 后 到 销毁 这 个 HandleScope 之 前 ”。 

这 样 一 来 就 需要 大 家 注意 “不 要 把 scope 弄 得 太 广 了 ”。 

下 面 我 们 来 说 明 一 下 原因 。 假 设 我 们 给 A 函数 定义 了 HandleScope， 而 没有 给 B 函数 定 
义 HandleScope。 在 这 种 情况 下 ， 如 果 B 函数 内 有 大 量 对 象 被 作用 ， 那 么 即使 B 函数 的 操作 
结束 ，A 函数 内 的 HandleScope 里 依然 会 残留 已 作用 的 指针 。 于 是 B 函数 内 作用 的 对 象 在 A 
函数 结束 之 前 会 被 视 为 活动 对 象 。 也 就 是 说 ， 非 活动 对 象 可 能 会 被 看 成 活动 对 象 (图 13.8 )。 
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HandleScope 
















B 函 数 内 的 handler 群 的 handler 群 












































的 handler 群 





的 handler 群 


























图 13.8 B 函 数 内 的 handler 群 残留 的 案例 


因为 有 可 能 发 生 这 种 问题 ， 所 以 大 家 需要 注意 不 可 让 HandleScope 的 有 效 范 围 太 广 。 


13.4.3 _ HandleScope 的 切换 
handler 管理 的 HandleScope 的 切换 非常 复杂 ， 下 面 就 来 实际 看 一 下 HandleScope 吧 。 





src/handles.h 





108 | class HandleScope { 


143 static v8::ImplementationUtilities::HandleScopeData current_; 
144 const v8::ImplementationUtilities::HandleScopeData Previous_; 
LT 二 





在 第 143 行 定义 了 HandleScope 的 current_ 类 变量 。v8: :ImplementationUtilities:: 
HandleScopeData 类 中 存 有 HandlerList 的 信息 。 请 大 家 注意 ，current_ 是 类 变量 。 也 就 是 
说 ,不 管 从 HandleScope 类 的 哪个 实例 出 发 ，current_ 都 指 着 相同 的 值 。 此 外 大 家 也 请 注意 ， 
current_ 持 有 的 不 是 指针 ， 而 是 实例 本 身 。 
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然后 用 current 类 变量 持 有 的 HandlerList 信息 来 管理 新 定义 的 handler。 男 一 方面 ， 第 
144 行 定义 的 成 员 变 量 previous_ 中 存 有 前 一 个 HandleScope 的 HandlerList 信息 。 

一 旦 在 函数 内 定义 了 HandleScope 类 类 的 局 部 变量 ， HandleScope 类 类 的 构造 函数 就 会 启动 ， 
将 现在 的 current_ 类 变量 的 内 容 存 人 (复制 到 ) 实 例 内 的 成 员 变 量 previous_ 中 ， 并 初始 化 


current_o 








src/handles.h 


110 HandleScope() : previous_(current_) { 
和 current_.extensions = 0; 
112 } 





可 见 第 110 行 的 成 员 变 量 previous_ 内 存 有 数据 。 另 外 , 第 111 行 负责 初始 化 Current_。 
调用 完 HandleScope 类 类 的 局 部 变量 所 定义 的 函数 之 后 ， 启 动 HandleScope 类 类 的 析 构 函数 
(destructor)。 在 析 构 函数 内 ， 将 存 入 previous_ 的 之 前 的 HandleScope 的 HandlerList 信息 回 


与 写 到 current_o 


src/handles.h 





114 “HandleScope() { 

115 Leave (&previous_) ; 

116 上 

155 static void Leave( 

156 const v8::ImplementationUtilities::HandleScopeData* previous) { 
160 current_ = *previous; 

164 上 


在 第 115 行 的 析 构 函数 内 调用 Leave() ， 在 第 160 行将 作为 参数 的 previous 内 的 值 回 写 
到 Current_o 
这 样 一 来 就 很 好 地 利用 了 构造 函数 和 析 构 函数 ， 即 使 语言 处 理 程序 的 实现 者 不 去 管 切换 
HandleScope 的 问题 ， 也 能 成 功 地 进行 实现 。 


13.4.4 “ 打 标 签 


接 下 来 要 讲 的 如 何 给 指针 打 标 签 。 
V8 的 标签 有 如 下 几 种 。 





表 13.5 标签 一 览 


0( 低 1 位 ) 





Failure 11( 低 2 位 ) 
HeapObject 01( 低 2 位 ) 
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表 13.5 中 有 一 点 很 让 人 在 意 ， 那 就 是 smi (内 骨 对 象 ) 的 标签 为 0o。 也 就 是 说 ,把 11( 二 
进 制 数字 ) 这 个 C++ 上 的 int 型 变换 成 smi 的 话 ， 就 成 了 110( 二 进 制 数字 )。 

为 什么 smi 的 标签 是 o 呢 ? 事实 上 ， 从 这 种 标签 的 设置 方法 上 可 以 看 出 V8 的 高 速 化 特征 。 

首先 ， 标签 为 0 说 明 将 数值 左 移 1 位 就 能 变换 成 smi。 也 就 是 说 ,可 以 高 速 地 实现 将 数 
值 变换 为 smi 的 操作 。 

此 外 ，smi 之 间 加 减 运算 的 速度 也 非常 快 。Rubinius 中 也 有 Fixnum 这 个 内 骸 对 象 。 以 
Fixnum 为 例 ， 因 为 标签 是 1， 所 以 计算 时 不 去 除 标签 的 话 ， 计 算 结 果 就 会 乱 套 。 另 一 方面 ， 
因为 V8 的 smi 的 标签 为 0， 所 以 在 执行 smi 之 间 的 加 减 运算 时 就 没 必 要 特意 去 除 标签 。 这 
样 一 来 就 能 实现 smi 之 间 的 高 速 运 算 。 

然而 事情 不 可 能 十 全 十 美 。 大 家 看 表 13.5 内 的 Heap0bject 的 标签 ， 标 签 是 01。 也 就 是 说 ， 
V8 会 在 指向 对 象 的 指针 上 打上 标签 。 

因为 V8 的 GC 是 基于 正确 的 根 而 执行 的 ， 所 以 原本 是 没 必 要 在 指向 对 象 的 指针 上 打 标 
签 的 。 但 是 因为 smi 的 标签 ( 低 1 位 ) 为 0， 所 以 smi 的 低 2 位 有 时 会 变 成 00。 也 就 是 说 ， 计 
算 机 有 可 能 将 其 跟 指向 对 象 的 指针 搞 混 ， 因 此 才 有 必要 特意 在 指向 对 象 的 指针 上 打上 标签 。 

给 指向 对 象 的 指针 打上 标签 ， 这 也 就 意味 着 在 访问 对 象 内 的 域 时 必须 去 除 标签 。 去 除 标 
签 的 操作 所 需要 的 开销 非常 大 ， 但 比 起 这 些 开 销 ，V8 更 重视 提升 smi 之 间 的 计算 速度 。 

此 外 ， 据 说 这 个 打 标签 的 方法 来 源 于 Self 的 VM。 有 兴趣 的 读者 请 参考 相关 论文 2 和 
源 代码 "。 


13.4.5 ”控制 对 象 内 的 域 


接 下 来 要 说 明 的 是 “控制 对 象 内 的 域 "， 这 是 为 了 实现 V8 的 准确 式 GC 而 特意 下 的 功夫 。 
这 里 的 对 象 指 的 是 “继承 了 HeapObject 类 的 类 的 实例 ”。 

在 V8 中 ,为 了 完全 掌握 对 象 内 的 域 在 内 存 中 的 位 置 ， 我 们 要 自行 将 对 象 内 所 有 的 域 配 
置 到 内 存 中 。 也 就 是 说 ， 按 照 C++ 的 规矩 定义 域 的 话 ， 计 算 机 会 自动 玫 我 们 编译 , 但 在 V8 
里 就 要 自己 来 编译 了 。 关 于 这 一 点 ， 我 们 实际 来 看 看 代码 吧 ， 这 样 或 许 理解 起 来 更 快 一 些 。 








































































































Src/objects-inl.h 
1084 | ACCESSORS (JSObject, properties, FixedArray, kProperties0ffset) 
这 部 分 给 JSObject 类 定义 了 properties 域 的 访问 顺 。 
参数 的 含义 分 别 如 下 所 示 。 





QD Self 官 方 网 站 : http://www.selflanguage.org。 
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定义 访问 器 的 类 

访问 器 名 

访问 器 返回 的 型 、 访 问 器 存储 的 型 

到 对 象 内 的 域 的 偏 移 值 ( 域 位 置 ) 


1. JSObject 





2. properties 





3. FixedArray 





4. kProperties0ffset 


下 面 来 深入 看 一 下 宏 ACCESSORS () 吧 。 


src/objects-inl.h 


75 | #define ACCESSORS (holder, name, type, offset) NS 
76 type* holder::name() { return type::cast(READ_FIELD(this, offset)); } \ 
77 void holder::set_##name(type* value, WriteBarrierMode mode) { \ 
78 WRITE_FIELD(this, offset, value); NN 
79 CONDITIONAL_WRITE_BARRIER(this, offset, mode); \ 
80 } 


674 | #define FIELD_ADDR(p, offset) \ 
675 (reinterpret_cast<byte*>(p) + offset - kHeapObjectTag) 


677 | #define READ_FIELD(P，offset) \ 
678 (*reinterpret_cast<0bject**>(FIELD_ADDR(p, offset))) 


680 | #define WRITE_FIELD(p, offset, value) \ 
681 (*reinterpret_cast<0bject**>(FIELD_ADDR(p, offset)) = value) 








将 宏 AccESSORS () 的 一 部 分 展开 ,得 到 如 下 代码 。 


JSObject::properties() { 
return FixedArray::cast( 
*reinterpret_cast<0bject**>(FIELD_ADDR(this, kProperties0ffset)) 
, 


JSObject::set_properties(FixedArray* value, WriteBarrierMode mode) { 
*reinterpret_cast<0bject**>(FIELD_ADDR(this, kProperties0ffset)) = value; 
CONDITIONAL_WRITE_BARRIER(this, kProperties0ffset, mode); 


#define FIELD_ADDR(p, offset) \ 


(reinterpret_cast<byte*>(p) + offset - kHeapObjectTag) 


请 大 家 注意 宏 FIELD_ADDR() 。 
给 p(this) 加 上 offset (kProperties0ffset), 减 去 kHeap0bjectTag。 
在 域 的 访问 器 (properties() 和 set_properties() ) 内 部 使 用 宏 FIELD_ADDR() 来 存 人 和 取 
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出 值 。 这 样 一 来 ， 对 象 内 的 域 的 位 置 就 成 了 宏 AccESSORS() 的 参数 指定 的 偏 移 的 位 置 。 


每 个 类 中 都 定义 了 像 kProperties0ffset 这 样 的 偏 移 。 


src/objects.h 
1307 | class JSoObject: public HeapObject { 


1673 static const int kProperties0ffset = HeapObject::kHeaderSize; 
1674 static const int kElements0ffset = kProperties0ffset + kPointerSize; 


1675 static const int kHeaderSize = kElements0ffset + kPointerSize; 














第 1673 行 的 Heap0bject::kHeaderSize 是 用 Heap0bject 定 义 的 域 的 总 大 小 。 
为 JSObject 继承 了 HeapObject， 所 以 必须 能 使 用 父 类 的 域 。 此 , 最 初 的 域 位 置 
(kProperties0ffset ) 就 在 HeapObject 类 内 的 域 的 定义 之 后 (Heapobject: : kHeaderSize )。 
另外 ， 对 要 继承 JSobject 的 类 而 言 ， 同 样 要 把 第 1675 行 的 JS0bject::kHeaderSize 设 定 








到 最 开始 的 域 位 置 。 
图 13.9 为 JSObject 类 内 的 域 的 状态 。 


JSObject 


HeapObject::kHeaderSize 
kPropertiesOffset 一 
JSObject::kHeaderSize 
kElementsOffset 一 





elements 


13.9 ”JSObject 类 内 的 域 位 置 


13.4.6 ”与 型 相对 应 的 访问 器 


除 AccESSORS() 之 外 ， 还 有 其 他 定义 域 的 访问 需 的 宏 。 根 据 存 储 值 的 型 的 不 同 ， 


可 分 为 以 下 两 种 。 
。 INT_ACCESSORS () 一 一 用 于 :int 型 
。SMI_ACCESSORS () 一 一 用 于 Smi 类 














以 上 宏 与 宏 AccESSORS () 的 一 大 不 同 在 于 ， 通 过 宏 定义 的 setter 没有 写 人 屏障 。 


Src/objects-inl.h 
70 | #define INT_ACCESSORS (holder, name, offset) % 
7 int holder::name() { return READ_INT_FIELD(this, offset); } \ 
?2 void holder::set_##name(int value) { WRITE_INT_FIELD(this, offset, value); } 


75 | #define ACCESSORS (holder, name, type, offset) AN 
76 type* holder::name() { return type::cast(READ_FIELD(this，offset)); } \ 


些 宏 





























13.4 通 往 准 确 式 GC 之 路 (V8 篇 ) 
了 7 void holder: :set_##name (type*k value, WriteBarrierMode mode) { \ 
78 WRITE_FIELD(this, offset, value); \ 
79 CONDITIONAL_WRITE_BARRIER(this, offset, mode); \ 
80 | } 


在 宏 ACCESSORS() 内 ， 第 79 行 的 CONDITIONAL_WRITE_BARRIER() 是 写 人 屏 
它 是 没有 写 人 屏障 的 。 这 





另 一 方面 ， 从 INT_ACCESSORS() 的 定义 来 看 ， 
型 和 内 艇 对 象 这 样 的 “ 非 指 针 值 ” 时 是 不 需要 写 入 屏障 的 。 











是 因为 存储 int 























又 因为 SMT_ACCESSORS () 是 用 于 smi 类 (内 艇 对 象 ) 的 访问 絮 
标签 的 操作 。 
Src/objects-inl.h 
84 | #define SMI_ACCESSORS (holder, name, offset) 
85 int holder::name() { \ 
86 Object* value = READ_FIELD(this, offset); 8 
87 return Smi::cast(value)->value(); \ 
88 } \ 
89 void holder::set_##name(int value) { 并 
90 WRITE_FIELD(this，offset，Smi::FromInt(value) ) ; \ 
91 } 








第 87 行 的 value() 是 去 除 标签 并 返回 正确 数值 的 成 员 函 
给 数值 打上 标签 的 成 员 函 数 。 


13.4.7 ” 域 的 位 置 和 准确 式 GC 


么 ， 完 全 控制 对 象 内 的 域 位 置 能 给 我 们 带 来 什么 好 处 呢 ? 
0 速 找 到 对 象 内 的 指针 了 。 
在 V8 中 控制 域 的 位 置 ， 把 指向 对 象 内 的 子 对 象 的 指针 连 绢 
不 是 所 有 类 都 是 这 个 结构 ,但 是 半数 以 上 的 类 都 是 在 内 存 中 连 旨 
下 面 来 实际 看 看 子 对 象 的 标记 操作 吧 。 


数 。 

















EE 


/ 





Src/objects.cc 
1230 
1231 
1232 
1233 | } 


void JSobject::JSobjectIterateBody(int object_size， 
// 把 对 象 内 的 指针 域 群 传递 给 visitor 
kProperties0ffset, 


IteratePointers(v， object_size) ; 


Src/objects-inl.h 





1022 | void Heap0bject::IteratePointers(0bjectVisitor+k v, int start, 


反 过 来 第 90 行 的 FromInt() 是 


， 所 以 带 有 设置 标签 和 去 除 











事实 上 ， 通 过 这 番 功 夫 ,， 在 











配置 在 同一 个 地 方 。 虽 然 并 
配置 指针 的 。 


ObjectVisitor* V) { 


int end) { 


397 
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1023 Vv->VisitPointers(reinterpret_cast<0bject**>(FIELD_ADDR(this, start)), 
1024 reinterpret_cast<0bject**>(FIELD_ADDR(this, end))); 
1025 | } 


JSobjectIterateBody() 最 终 把 JSsobject 类 实例 内 的 指针 群 的 开头 和 结尾 位 置 交 给 
visitor (ObjectVisitor 类 的 实例 ) 中 定义 的 成 员 男 数 VisitPointers()。 

执行 标记 操作 的 时 候 ， 需 要 把 继承 了 ObjectVisitor 类 的 “用 于 标记 子 对 象 的 visitor 类 ” 
的 实例 传递 给 JS0bjectIterateBody() 的 参数 v。 这 个 类 的 成 员 函 数 VisitPointers() 负责 标 
记 所 传递 的 指针 群 指向 的 对 象 。 

此 时 因为 指向 对 象 的 指针 在 内 存 中 是 连续 排列 的 ， 所 以 能 迅速 发 现 子 对 象 。 




















(D 指针 的 域 呈 分 散 状态 (2) 指针 的 域 呈 连 续 状 态 


-一 标记 -一 标记 
|_ 标记 过 ,容易 标记 
标记 


| 标记 
标记 


对 象 














跳 着 标记 





图 13.10 ”指针 的 域 位 置 和 标记 


下 天 ; 齐 GC 标记 一 压缩 算法 


V8 中 实现 了 下 面 几 种 GC 算法 。 


。GC 复制 算法 
。GC 标 记 一 清除 算法 
。GC 压缩 算法 


本 章 中 我 们 将 对 “实现 篇 ”中 未 解说 的 GC 标记 - 压缩 算法 进行 讲解 。 
13.5.1 GC 算法 


V8 的 GC 标记 - 压缩 算法 采用 的 是 第 5 章 中 讲 到 的 Lisp2 算法 ， 关 于 算法 的 内 容 请 查阅 
$1 





13.5 ”GC 标记 -压缩 算法 ”399 





13.5.2 ”启动 GC 的 时 机 


基本 上 讲 ， 在 把 对 象 分 配 到 各 自 的 GC 所 对 应 的 内 存 空间 时 ， 如 果 分 配 失 败 了 的 话 ， 就 
会 启动 GC。 
启动 新 生 代 GC (GC 复制 算法 ) 的 时 机 如 下 所 示 。 


。 新 生 代 空间 的 From 空 间 没 有 分 块 的 时 候 





老年 代 GC (GC 标记 - 清除 算法 及 GC 标记 - 压缩 算法 ) 的 启动 时 机 如 下 所 示 。 

。 老 年 代 空 间 的 某 一 个 空间 没有 分 块 的 时 候 

。 老 年 代 空 间 中 被 分 配 了 一 定数 量 的 对 象 的 时 候 ( 启 动 新 生 代 GC 时 检查 ) 

。 老 年 代 空 间 里 没有 新 生 代 空间 大 小 的 分 块 的 时 候 ( 不 能 保证 执行 新 生 代 GC 时 的 晋升 ) 





在 老年 代 GC 的 启动 过 程 中 ,启动 GC 标记 - 压缩 算法 的 时 机 如 下 所 示 。 


。 老 年 代 空 间 的 碎片 到 达 一 定数 量 的 时 候 





最 后 在 对 老年 代 空 间 执 行 分 配 及 释放 操作 时 计算 碎片 的 量 。 
13.5.3 GC 概要 
下 面 来 看 一 下 GC 标记 - 压缩 算法 的 函数 的 整体 情况 。 





Src/heap.cc 
505 | void Heap: :MarkCompact(GCTTracer# tracer) { 
506 gc_state_ = MARK_COMPACT ; 


507 mc_count_++; 
508 tracer->set_full_gc_count (mc_count_) ; 
510 


/* GC 预 处 理 */ 

514 MarkCompactCollector: :Prepare(tracer); 
512 
513 bool is_compacting = MarkCompactCollector::IsCompacting(); 
514 
515 MarkCompactPrologue(is_compacting); 
516 
/* GC 开始 */ 

517 MarkCompactCollector: :CollectGarbage(); 
518 
/* GC 后 处 理 */ 

519 MarkCompactEpilogue(is_compacting); 
520 
B23 gc_state_ = NOT_IN_GC; 
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524 
525 Shrink(); 
529|} 





第 511 行 到 第 515 行 的 GC 前 处 理 中 进行 的 操作 有 : 决定 执行 GC 标记 -压缩 算法 
还 是 GC 标记 -清除 算法 , 把 各 个 内 存 空间 初始 化 以 用 于 GC 等 。 第 513 行 的 成 员 函 数 
IsCompacting() 在 使 用 GC 标记 - 压缩 算法 时 为 真 。 

接 下 来 用 MarkCompactCollector 类 的 成 员 函 数 collectGarbage() 实际 执行 GC。 

在 GC 的 后 处理 中 进行 的 操作 有 : 释放 因 GC 而 变 为 空 的 老年 代 页 面 等 。 

此 外 ， 虽然 这 个 函数 中 没有 出 现 ， 不 过 GC 中 VM Heap 是 被 锁定 的 ， 禁 止 分 配对 象 。 


EO@@ 
GC 标记 一 清除 算法 和 GC 标记 一 压缩 算法 的 实现 类 
在 V8 的 源 代码 里 是 不 存在 MarkSweep 类 这 种 东西 的 。GC 标记 - 清除 算法 是 在 MarkCompact 
类 里 实现 的 。 
GC 标记 - 清除 算法 和 GC 标记 - 压缩 算法 的 实现 有 很 多 相似 的 部 分 ， 所 以 笔者 也 能 理解 大 
家 想 用 同一 个 类 来 搞定 它们 的 心情 ， 但 很 显然 类 名 会 说 谎 ， 这 就 是 读 源 代码 时 让 人 恶心 的 地 方 。 
比 外 ， 源 代码 的 文件 分 审 也 错乱 不 堪 。 例 如 在 object.h 这 个 文件 中 包含 继承 了 object 类 的 各 
种 类 的 定义 。 正 因为 这 样 ， 读 源 代码 时 才 会 那么 麻烦 ， 有 时 甚至 会 搞 不 清楚 哪个 类 包含 在 哪个 文件 里 。 
依 笔者 所 见 ，V8 也 许 应 该 重新 审视 一 下 各 个 类 及 其 所 包含 的 文件 在 意思 上 的 粒度 。 
我 们 在 此 学 到 的 教训 就 是 “天 才 集 团 Google 也 会 在 设计 上 出 现 失误 ”。 发 气 这 种 地 方 也 是 解 
读 程序 内 容 ( 源 代码 ) 的 乐趣 之 一 。 如 果 我 们 只 把 程序 当成 工具 来 用 ， 那 么 是 不 会 注意 到 这 种 事情 的 。 





















































































































































由 志 届 标记 阶段 


V8 的 标记 阶段 有 着 其 他 处 理 程序 没有 的 有 趣 细节 ,在 这 一 记 中 我 们 将 会 重点 介绍 这 些 
细节 内 容 。 


13.6.1 ”标记 阶段 的 概要 
实际 执行 GC 的 是 以 下 成 员 函 数 。 





src/mark-compact.cc 


65 | void MarkCompactCollector::CollectGarbage() { 


72 if (IsCompacting()) tracer_->set_is_compacting(); 


13.6 标记 阶段 401 
3 





74 MarkLiveOQbjects(); 
时 各 
/* 省 略 : 压缩 阶段 */ 
100 | 上 





标记 操作 是 在 第 74 行 的 成 员 子 数 MarkLive0bjects() 内 进行 的 。 
在 MarkLive0bjects() 内 执行 的 操作 有 以 下 两 项 。 

。 生 成 标记 栈 

。 标 记 操 作 





这 个 标记 栈 指 的 到 底 是 什么 呢 ? 
13.6.2 ”生成 标记 栈 





V8 采用 深度 优先 来 执行 标记 操作 。 也 就 是 说 ， 在 标记 对 象 时 ， 首 先 标记 这 个 对 象 ， 然 
后 标记 它 的 第 一 个 子 对 象 ， 再 标记 它 的 第 一 个 孙 对 象 。 

在 实现 深度 优先 的 标记 操作 时 ， 递 归 调 用 函数 是 很 正常 的 。 然 而 ， 在 递归 执行 标记 操作 
时 有 一 个 问题 ， 就 是 “调用 函数 的 额外 负担 "”。 当 所 标记 的 对 象 的 层次 太 深 时 ， 有 时 会 调用 
出 数量 惊人 的 函数 。 


因此 ，V8 中 会 自行 生成 用 于 标记 的 栈 ( 标 记 栈 )， 利 用 这 个 栈 反复 执行 标记 操作 。 
标记 栈 使 用 的 是 新 生 代 空间 的 From 空间 。 在 执行 老年 代 GC (GC 标记 - 

肯定 要 执行 新 生 代 GC (GC 复制 算法 )。 这 样 一 来 ， 我 人 
间 为 空 。 也 就 是 说 ， 反 正 From 空 


生成 标记 栈 的 代码 如 下 所 示 。 














压缩 算法 ) 之 前 ， 


] 就 通过 GC 复制 算法 保证 了 From 空 
空间 都 空 着 了 ， 就 干脆 把 它 用 作 标 记 栈 吧 。 




















Src/mark-compact.cc 

734 | void MarkCompactCollector: :MarkLive0bjects() { 

741 marking_stack.Initialize(Heap: :new_space()->FromSpaceLow() 
742 


Heap: :new_space()->FromSpaceHigh()); 


数 a 负责 返回 From 空 


成 员 函 
负责 返回 其 结尾 地 址 。 


空间 的 开头 地 址 ， 成 员 函 
之 相反 ， 


困 数 FromSpaceHigh() 则 与 
src/heap.h 


1335 | class MarkingStack { 
1336 | public: 


1337 void Initialize(Address low, Address high) { 
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1338 top_ = low_ = reinterpret_cast<Heap0bject**>(low); 
1339 high_ = reinterpret_cast<HeapObject*x#k>(high) ; 

1341 } 

1370 


1371 | private: 
1372 HeapObject** low._; 
1373 HeapObject** top_; 





1374 HeapObject** high_; 


在 这 里 使 用 MarkingStack 类 的 成 员 函 数 Initialize() 来 初始 化 标记 栈 。 
此 外 ，MarkingStack 类 里 还 定义 了 用 来 执行 栈 操作 的 成 员 函 数 Push() 和 Pop()。 关 于 函 
数 内 的 检查 操作 这 里 就 略 去 了 。 


src/heap.h 
1354 void Push(HeapObject* object) { 
1360 *(top_++) = object; 
1362 小 
1364 HeapObject* Pop() { 
1366 HeapObject* object = *(--top_); 
1368 return object; 
1369 小 








图 13.11 是 成 员 函 数 Push() 和 Pop() 的 运作 示意 图 。 








object 
标记 栈 ( From 空间 ) PushO 
站 CC 
| 
low top high_ top 
object 
Pop0O 
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t t t 人 
low_ top high_ top_ 


13.11 标记 栈 的 Push() 和 Pop() 
关于 标记 栈 的 用 法 ， 我 们 会 在 之 后 的 13.6.6 节 中 为 大 家 说 明 。 
13.6.3 _ 标记 根 
现在 来 大 概 介绍 一 下 V8 中 的 根 。 
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。JavaScript 中 的 内 置 类 (Map )、 吕 数 、 符 号 
。HandleScope 
。V8 中 的 全 局 变量 


可 以 看 出 ， 这 跟 之 前 讲 过 的 语言 处 理 程序 基本 一 致 。 
下 面 来 看 一 下 标记 根 的 函数 。 





src/mark-compact.cc 


734 | void MarkCompactCollector: :MarkLive0bjects() { 


/* 生成 标记 栈 */ 





746 RootMarkingVisitor root_visitor; 


747 MarkRoots(&root_visitor); 





783|} 











首先 通过 成 员 函 数 MarkLiveObjects() 来 执行 标记 操作 。 第 746 行 生成 的 RootMarkingVisitor 类 的 
实例 是 用 于 标记 根 的 visitor， 第 747 行 的 成 员 函 数 MarkRoots() 才 是 执行 根 的 标记 操作 的 实体 。 
关于 这 个 函数 的 后 半 部 分 ， 我 们 将 在 之 后 的 13.6.7 节 中 为 大 家 说 明 。 














src/mark-compact.cc 


595 | void MarkCompactCollector::MarkRoots(RootMarkingVisitor* visitor) { 
598 Heap: :IterateStrongRoots(Vvisitor) ; 
599 


601 MarkSymbolTable(); 


/* 省 略 : 标记 栈 溢 出 时 的 对 策 */ 





608 | } 


在 第 598 行 的 成 员 困 数 Heap: :IterateStrongRoots() 内 使 用 用 于 标记 根 的 visitor。 


Src/heap.cc 


3080 | void Heap::IterateStrongRoots(0bjectVisitor* V) { 





/* 标记 JavaScript 中 的 内 置 类 (Map )、 函 数 、 符 号 */ 
3081 Vv->VisitPointers(&roots_[0], &roots_[kStrongRootListLength]); 











/* 其 他 标记 根 的 操作 */ 








3117 | 汪 
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接 下 来 我 们 将 对 第 3081 行 的 标记 根 的 操作 进行 说 明 。roots_ 内 存 有 内 置 类 的 信息 (C++ 中 的 
Map 类 )、 函 数 以 及 符号 等 。 此 外 ， kStrongRootListLength 中 保留 着 roots_ 末尾 的 索引 。 


13.6.4 ”标记 对 象 





用 于 标记 根 的 visitor 在 获取 了 根 内 的 指针 群 后 ， 就 会 执行 深度 优先 的 标记 操作 。 


src/mark-compact.cc 


333 


339 


340 


341 


367 





class RootMarkingVisitor : public ObjectVisitor { 


void VisitPointers(0bject## start, Object** end) { 
for (Object** p = start; p < end; p++) Mark0bjectByPointer(p); 


}; 


接 下 来 只 需要 在 第 339 行 定义 的 成 员 函 数 VisitPointers() 内 对 根 内 的 指针 调用 
Mark0bjectByPointer() 即 可 。 


src/mark-compact.cc 


346 


348 


349 
350 


352 


353 


355 
357 


359 
360 
361 


366 





MarkingVisitor stack_visitor.; 


void MarkObjectByPointer (Object** p) { 
/* 检查 是 否 为 指向 对 象 的 指针 */ 


if (!(*p)->IsHeapObject()) return; 


/* 转换 到 Heap0bject 类 的 指针 */ 


HeapObject* object = ShortCircuitConsString(p); 


/* 检查 是 否 为 未 标记 的 对 象 */ 


if (object->IsMarked()) return; 


/* 标记 对 象 */ 
Map* map = object->map(); 
MarkCompactCollector: :SetMark (object); 


/* 标记 子 对 象 */ 
MarkCompactCollector: :Mark0bject (map); 
object->IterateBody (map->instance_type(), object->SizeFromMap (map) ， 


&stack_visitor_); 








/* 省 略 : 使 用 了 标记 栈 的 深度 优先 标记 */ 
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这 个 Mark0bjectByPointer() 是 标记 操作 的 核心 部 分 。 

因为 参数 p 有 可 能 是 标记 对 象 范围 之 外 的 对 象 ， 即 smi， 所 以 在 第 349 行 检查 p 是 否 为 
指向 对 象 的 指针 ， 在 第 353 行 确认 对 象 为 未 标记 状态 。 

经 过 一 番 检查 后 ， 在 第 357 行 执行 对 象 的 标记 操作 。 

然后 用 第 360 行 的 成 员 函 数 IterateBody() 标记 对 象 内 的 子 对 象 。 


13.6.5 











标记 子 对 象 











因为 对 象 的 类 不 同 ， 内 部 指针 的 位 置 也 不 同 ， 所 以 要 通过 与 各 个 对 象 的 类 相应 的 成 员 函 
数 IterateBody() 来 执行 子 对 象 的 标记 操作 。 








src/mark-compact.cc 


1098 
1099 


1116 
T1417 
1118 
1119 
1120 
E421 
1122 
1123 
1124 
L425 
1126 
127 
1128 
1129 


1130 


1156 
1167 





void HeapObject::IterateBody(InstanceType type, int object_size， 


ObjectVisitor* V) { 


switch (type) { 
case FIXED_ARRAY_TYPE: 


reinterpret_cast<FixedArray*>(this)->FixedArrayIterateBody(v); 


break; 


case 


case 


case 


case 


case 


case 


case 


case 


case 





S_0BJECT_TYPE: 
S_CONTEXT_EXTENSION_OBJECT_TYPE: 
S_VALUE_TYPE: 

S_ARRAY_TYPE: 

S_REGEXP_TYPE: 

S_FUNCTION_TYPE: 
S_GLOBAL_PROXY_TYPE: 
S_GLOBAL_0BJECT_TYPE : 
S_BUILTINS_0BJECT_TYPE : 


reinterpret_cast<JSObject*>(this)->JSObjectIterateBody( 


object_size, vV); 


break; 


/* 省 略 : 跟 type 有 关 的 case 语 句 */ 


} 











第 1129 行 的 JSobjectIterateBody() 函数 在 13.4.7 市 中 也 曾 出 现 过 ， 该 函数 负责 把 指向 标记 
对 象 内 的 子 对 象 的 指针 和 群 交 给 visitor。 此 时 ， 作 为 参数 给 出 的 v(visitor) 是 MarkingVisitor 类 的 实例 。 

MarkingVisitor 类 最 终 将 所 得 到 的 指向 子 对 象 的 指针 作为 参数 ,来 调用 
MarkCompactCollector 类 的 成 员 函 数 MarkUnmarked0bject()。 

当 对 象 的 型 是 JS_0BJECT_TYPE 时 ， 函 数 调 用 图 如 代码 清单 13.1 所 示 。 
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代码 清单 13.1: 标记 子 对 象 的 调用 图 

















HeapObject::IterateBody() 一 一 根据 型 进行 分 配 
JSobjectIterateBody: :IterateBody() 一 一 将 其 中 的 指针 群 传递 给 visitor 
MarkingVisitor::VisitPointers() 一 一 将 指针 群 传递 给 标记 函数 
MarkCompactCollector: :MarkUnmarked0bject() 标记 子 对 象 





下 面 来 看 看 负责 标记 子 对 象 的 MarkUnmarkedObject () 巴 。 函 数 内 虽然 有 用 于 Map 的 标 
记 操 作 ， 不 过 与 我 们 要 解说 的 内 容 无 关 ， 因 此 略 去 不 提 。 
Src/mark-compact.cc 


425 | void MarkCompactCollector::MarkUnmarkedObject (HeapObject* object) { 
428 if (object->IsMap()) { 


/* 省 略 : 用 于 Map 的 标记 操作 */ 
441 } else { 


/* 标记 子 对 象 */ 
442 SetMark(object) ; 





/* 往 标 记 栈 里 堆积 子 对 象 */ 
443 marking_stack.Push(object); 
444 了 

445 | } 








这 里 有 一 处 需要 大 家 注意 ， 就 是 第 443 行 中 往 标记 栈 里 堆积 指向 子 对 象 的 指针 的 地 方 。 
也 就 是 说 ， 作 为 标记 对 象 的 所 有 子 对 象 被 标记 以 后 ， 都 会 被 堆积 到 标记 栈 。 
13.6.6 ”采用 了 标记 栈 的 深度 优先 标记 


现在 来 讲解 一 下 之 前 在 RootMarkingVisitor 类 的 成 员 函 数 Mark0bjectByPointer() 中 省 
略 的 内 容 吧 。 因 为 函数 的 前 半 部 分 内 容 已 经 在 13.6.4 节 说 明 过 了 ， 所 以 就 不 再 袭 述 了 。 





src/mark-compact.cc 


333 | class RootMarkingVisitor : public ObjectVisitor { 
346 MarkingVisitor StacKk_Visitor_; 
348 void MarkObjectByPointer (Object** p) { 


省 略 : 标记 对 象 */ 
/* 省 略 : 标记 子 对 象 */ 








365 
366 








/* 采用 了 标记 栈 的 深度 优先 标记 */ 
MarkCompactCollector: :EmptyMarkingStack(&stack_visitor.); 
} 








367 | }; 
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顾名思义 ， EmptyMarkingStacK() 是 一 直 执 行 标 记 操作 ， 直 到 标记 栈 为 空 的 函数 。 








src/mark-compact.cc 


649 


650 





void MarkCompactCollector: :EmptyMarkingStack(MarkingVisitor#k visitor) { 
/* 在 标记 栈 为 空 之 前 一 直 循环 */ 


while (!marking_stack.is_empty()) { 





/* 从 标记 栈 中 取出 指针 */ 
HeapObject* object = marking_stack.Pop(); 





/* 取出 Map */ 

MapWord map_word = object->map_word(); 
map_word.ClearMark(); 

Map* map = map_word.ToMap(); 
Mark0bject (map) ; 


/* 标记 子 对 象 */ 
object->IterateBody (map->instance_type(), object->SizeFromMap (map), 


visitor); 


标记 栈 里 存 有 指向 “标记 完毕 的 对 象 * 以 及 “ 子 对 象 未 被 标记 的 对 象 ” 的 指针 。 
EmptyMarkingStack() 负责 把 这 些 指针 从 标记 栈 中 一 个 个 取出 来 ， 并 标记 子 对 象 。 这 样 一 来 ， 
就 会 有 更 多 对 象 的 子 对 象 被 堆积 到 标记 栈 。 也 就 是 说 ， EmptyMarkingStack() 反复 用 深度 优 


先 的 方式 对 标记 栈 内 的 对 象 执行 了 标记 。 























图 13.12 展示 了 在 EmptyMarkingStack() 内 是 如 何 使 用 标记 栈 的 。 
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object 
标记 栈 PopO 
t t 1 
low_ top_ high_ 


由 object -> IterateBody!() 


object 的 子 对 象 
Push() 


top_ 


由 object -> IterateBody!() 
: 直到 标记 栈 为 空 


图 13.12 采用 了 标记 栈 的 深度 优先 标记 


13.6.7 ”标记 栈 的 溢出 


当 标 记 对 象 的 层次 非常 非常 深 时 ， 标 记 栈 就 有 可 能 溢出 。 
因此 我 们 写 出 了 应 对 标记 栈 洪 出 的 操作 。 





src/heap.h 


1335 | class MarkingStack { 

1343 bool is_full() { return top. >= high_; } 
1347 bool overflowed() { return overflowed_; } 
1348 


1349 void clear_overflowed() { overflowed_ = false; } 


1354 void Push(HeapObject# object) { 
1356 if (is_ful1()) 





1357 
1358 
1359 
1360 
1361 
1362 


1375 
1376 
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/* 次 出 时 的 对 策 */ 
object->SetOverflow() ; 


overflowed_ = true; 
} else { 
*(top_++) = object; 


} 
} 


bool overflowed_; 


}; 





事实 上 这 里 是 在 MarkingStack 类 的 Push() 内 检查 标记 栈 是 否 溢出 的 。 如 果 标 记 栈 发 生 
溢出 ， 就 不 把 Push() 对 象 的 指针 追加 到 标记 栈 ， 而 是 像 第 1357 行 代码 那样 给 对 象 打上 “ 洲 
出 标记 ”。 也 就 是 说 ， 无 视 那 些 溢 出 后 应 该 被 Push() 到 标记 栈 的 指针 。 然 后 在 第 1358 行将 
overflowed_ 设 为 true， 记 录 标 记 栈 自身 也 发 生 了 洲 出 这 一 信息 。 

即使 标记 栈 发 生 过 溢出 ， 也 并 不 意味 着 就 不 能 再 次 利用 它 。 只 要 Pop() 一 下 ， 标 记 栈 内 
就 有 了 空间 ， 就 能 再 次 Push() 了 。 

那么 新 的 问题 又 出 现 了 ， 这 里 没有 把 那些 在 溢出 时 Push() 了 的 对 象 实际 追加 到 标记 栈 ， 
而 是 无 视 了 它们 。 也 就 是 说 ， 它 们 还 处 于 “ 子 对 象 未 被 标记 ”的 状态 。 如 果 就 这 样 继续 执行 
操作 的 话 ， 就 会 出 现 “ 标 记 遗 漏 ” 的 对 象 ， 导 致 错误 释放 掉 活 动 对 象 。 那 么 要 怎么 样 才 能 避 
免 发 生 “ 标 记 遗 漏 ” 呢 ? 

之 前 给 对 象 打上 的 “溢出 标记 ”在 这 里 就 派 上 用 场 了 。V8 就 是 利用 这 个 溢出 标记 来 解决 “ 标 
记 遗 漏 ” 问 题 的 。 
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595 


604 
605 
606 
607 
608 





void MarkCompactCollector: :MarkRoots(RootMarkingVisitor* visitor) { 


/* 省 略 : 标记 根 */ 


while (marking_stack.overflowed()) { 
RefillMarkingStack(); 
EmptyMarkingStack(visitor->stack_visitor()); 
上 
} 


我 们 在 这 里 写 明 了 成 员 函 数 MarkRoots() 内 发 生 洪 出 时 的 应 对 方法 ， 这 个 成 员 函 数 在 
13.6.3 节 中 也 出 现 过 。 第 604 行 的 成 员 函 数 overflowed() 只 在 标记 栈 发 生 游 出 时 返回 true。 
下 面 来 看 一 下 在 第 605 行 调用 的 RefillMarkingStack() 吧 。 


src/mark-compact.cc 


674 


void MarkCompactCollector: :RefillMarkingStack() { 
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677 SemiSpaceIterator new_it(Heap::new_space(), &0verflow0bjectSize); 
678 ScanOverflowedO0bjects(&new_it); 
679 if (marking_stack.is_full()) return; 


/* 省 略 : 调查 VM Heap 内 的 所 有 内 存 空间 的 操作 */ 
/* 将 标记 栈 内 的 overflowed_ 设 为 false */ 


706 marking_stack.clear_overflowed(); 


707'| 3 





在 第 678 行 调用 na ne 函数 ， 来 一 个 一 个 地 取出 作为 参数 的 内 存 空 
间 内 的 对 象 ， 调 查 这 个 对 象 是 否 打 上 了 “溢出 标记 ”。 如 果 对 象 已 经 打上 了 溢出 标记 ， 就 将 
其 Push() 到 标记 栈 。 

在 第 679 行 调查 标记 栈 是 否 已 满 。 当 标记 栈 满 了 的 时 候 ， 就 返回 到 调用 方 ， 继 续 在 
MarkRoots() 内 调用 第 606 行 的 EmptyMarkingStack()。 

接 下 来 用 RefillMarkingStack() 对 VM Heap 内 的 全 部 内 存 空间 执行 溢出 对 象 的 检查 操作 。 
也 就 是 说 ， 这 里 执行 的 操作 是 把 VM Heap 内 的 对 象 一 个 个 取出 来 ,， 来 标记 那些 因为 溢出 而 
导致 子 对 象 没 有 得 到 标记 的 对 象 。 通 过 这 项 操作 就 解决 了 “标记 遗漏 ”的 问题 。 

这 样 一 来 , 一 旦 标记 栈 发 生 洲 出 ， 就 需要 反复 (运气 好 的 话 一 次 就 搞定 了 ) 搜 索 VM 
Heap。 这 项 操作 非常 慢 ， 不 过 只 要 不 弄 出 层次 超级 深 的 对 象 ， 标 记 栈 是 不 会 发 生 溢出 的 ， 
大 家 基本 上 也 不 会 生成 这 种 对 象 。 


13.6.8 ”对 象 的 标志 位 


大 家 也 知道 ，Heap0bject 类 的 实例 开头 肯定 有 着 持 有 Map 实例 地 址 (map 地 址 ) 的 域 。 标 
志 位 中 就 要 使 用 这 个 map 地 址 的 一 部 分 。 

Map 类 的 实例 是 对 象 ， 因 为 低 2 位 打 了 标签 ， 所 以 map 地 址 肯定 是 01， 我 们 就 利用 这 一 
点 来 设置 标记 。 













































































Src/object.h 
1097 static const int kMarkingBit = 0; // 标志 位 
1098 static const int kMarkingMask = (1 << kMarkingBit); 
1099 static const int koOverflowBit = 1; // 淤 出 位 
1100 static const int kOverflowMask = (1 << kOverflowBit); 


首先 把 map 地址 的 低 1 位 作为 标志 位 来 使 用 ， 把 低 2 位 作为 溢出 标记 (位 ) 来 使 用 。 关 于 
溢出 标记 我 们 已 经 在 13.6.7 节 中 解说 过 了 。 第 1097 行 到 第 1100 行 负责 定义 用 于 标记 和 洲 出 
标记 的 撼 人 码 。 
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指向 Map 的 指针 
标志 位 
溢出 位 


图 13.13 标志 位 及 溢出 位 


然后 用 Heapobject 类 的 成 员 函 数 setMark() 执行 实际 的 标记 操作 。 


Src/objects-inl.h 
897 | void MapWord: :SetMark() { 
898 Value_ &= “kMarkingMask; 
899 | 上 


1038 | void Heap0bject::SetMarK() { 

1040 MapWord first_word = map_word() ; 
1041 first_word.SetMark() ; 

1042 set_map_word(first_word); 

1043 | 上 



































在 V8 中 ， 如 果 map 地 址 的 低 1 位 是 1， 就 是 “未 标记 ”; 如 果 是 0， 就 是 “已 标记 ”。 
为 这 里 的 标志 位 的 用 法 和 其 他 章 相 反 ， 所 以 请 大 家 多 加 注意 。 

接着 在 第 1040 行 用 map_word() 取出 map 地 址 ,在 第 1041 行 调 用 Mapworda 类 的 成 员 郴 
数 SetMark()。 在 SetMark() 内 ,在 第 898 行 把 map 地 址 (value_) 的 低 工 位 设 为 0。 通过 这 
项 操作 ，map 地 址 就 被 标记 完毕 了 。 之 后 再 用 第 1042 行 的 成 员 函 数 set_map_word() 给 对 象 
设 定 已 标记 的 map 地 址 。 

男 一 方面 ， 成 员 消 数 clearMark() 则 被 用 于 去 除 标 记 。 


























Src/objects-inl.h 
902 | void MapWord: :ClearMark() { 
903 Value_ |= kMarkingMask; 
904 | 上 


1046 | void Heap0bject::ClearMarK() { 
1048 MapWord first_word = map_word() ; 
1049 first_word.ClearMark(); 

1050 set_map_word(first_word); 

1051 | } 




















Heap0bject 类 的 ClearMark() 和 SetMark() 两 者 只 有 第 1049 行 是 不 同 的 。 
最 后 在 MapWord 类 的 成 员 函 数 clearMark() 的 第 903 行将 低 1 位 设 为 1， 消 去 标记 。 
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下 上 再 而 压缩 阶段 


在 标记 阶段 中 所 有 活动 对 象 都 已 经 被 标记 了 。 这 一 节 中 我 们 将 介绍 压缩 阶段 的 处 理 ， 即 
以 对 象 的 标记 为 基础 ， 压 缩 VM Heap, 在 VM Heap 内 生成 连续 的 分 块 。 


13.7.1 ”压缩 阶段 概要 


虽然 V8 把 内 存 空间 分 成 了 页 面 ， 不 过 压缩 本 身 还 是 和 第 5 章 中 介绍 的 Lisp2 算法 基本 
相同 。 
标记 阶段 结束 后 ， 所 有 活动 对 象 都 被 打上 了 标记 (图 13.14)。 

































































根 
内 存 空间 (老年 代 空间 ) 
页 面 0 v 
A 

页 面 1 | Vv 

B C 
页 面 2 | M4 

D E 


图 13.14 (1) 标 记 阶段 结束 后 


在 压缩 阶段 ， 需 要 把 活动 对 象 从 页 面 0 的 开头 按 顺 序 移动 。 当 移动 过 程 全 部 结束 后 ， 压 
缩 阶段 也 就 结束 了 。 可 见 图 13.15 中 已 经 从 页 面 0 的 开头 按 顺序 配置 了 图 13.14 中 的 活动 对 
象 A、B、C、D、F。 





内 存 空间 (老生 
















































































图 13.15”(2) 压 缩 阶段 结束 后 
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本 章 和 “算法 篇 " 在 压缩 阶段 的 不 同 在 于 ， 配 置 对 象 的 空间 是 按照 页 面 来 分 割 的 。 因 此 
这 里 必须 或 多 或 少 地 执行 一 些 复杂 的 操作 。 





我 们 用 成 员 函 数 collectGarbage() 来 执行 GC， 函数 的 内 容 如 下 所 示 。 男 外 ， 子 数 内 标 


记 阶 段 的 操作 已 经 在 之 前 介绍 过 了 ， 这 次 就 省 略 不 担 了。 还 有 ，GC 标记 - 清除 算法 的 清除 
操作 也 一 并 省 略 了 。 
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65 


‘2 


73 


78 


80 


8 
82 


83 
84 


85 
86 


87 


89 


91 


100 





void MarkCompactCollector::CollectGarbage() { 


if (IsCompacting()) tracer_->set_is_compacting(); 


/* 省 略 ; 标记 阶段 (已 在 上 一 节 中 解说 过 ) */ 











SweepLarge0bjectSpace(); 


if (IsCompacting()) { 
/* (1) 设 定 forwarding 指 针 */ 


EncodeForwardingAddresses(); 


/* (2) 更 新 指针 */ 


UpdatePointers(); 


/* (3) 移动 对 象 */ 


Relocate0bjects() ; 


/* (4) 更 新 记录 集 */ 





RebuildRSets() ; 
} else { 

/* 省 略 : 标记 阶段 的 清除 阶段 */ 
3 


/* 省 略 : 后 处 理 */ 





} 























在 这 里 对 老年 代 空 间 的 大 型 对 象 空间 ( 表 13.4) 执行 的 是 清除 操作 而 不 是 压缩 操作 。 因 为 
大 型 对 象 没有 被 分 配 到 VM Heap， 而 是 被 分 配 到 了 由 0S 直接 分 配 的 空间 ， 所 以 是 不 能 对 其 执 
行 压缩 的 。 第 78 行 的 SweepLarge0bjectSpace() 困 数 负责 执行 大 型 对 象 空间 的 清除 操作 。 

第 81 行 到 第 85 行 的 压缩 阶段 跟 5.1 节 中 出 现 的 三 个 步骤 完全 相同 。 在 讲解 第 81 行 到 
第 85 行 中 的 成 员 函 数 时 ， 请 大 家 一 边 参考 第 5 章 一 边 往 下 阅读 。 

第 87 行 的 RebuildRsets() 负责 根据 那些 因 压缩 而 移动 了 的 对 象 重 新 构建 记录 集 。 函 数 
名 里 的 RSet 是 Remembered set (记录 集 ) 的 缩写 。 
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13.7.2 (人 ) 设 定 forwarding 指 针 

在 第 5 章 中 介绍 的 Lisp2 算法 有 个 前 提 ， 就 是 对 象 内 已 经 准备 了 用 于 forwarding 指针 的 域 。 
然而 如 果 把 那些 只 在 压缩 时 使 用 的 forwarding 指针 的 域 分 配 到 所 有 对 象 内 ， 就 会 降低 内 存 的 
使 用 效率 。 因 此 ，V8 没有 另外 准备 用 于 forwarding 指针 的 域 ， 而 是 把 forwarding 指针 存在 各 
个 对 象 所 持 有 的 map 域 (对 象 内 存储 map 地 址 的 域 ) 里 。 
可 是 如 果 直 接 把 目标 空间 的 地 址 存在 map 域 里 ， 原 有 的 map 地 址 的 信息 就 会 消失 掉 了 。 
因此 V8 中 是 把 目标 空间 的 地 址 和 map 地 址 这 两 者 的 信息 都 编码 化 ， 把 “编码 化 的 forwarding 
指针 ” 存 人 map 域 里 。 

正 因 如 此 ， 开 发 者 才 把 设 定 forwarding 指针 的 函数 名 定 为 EncodeForwardingAddresses()。 员 
数 名 中 的 Encode 有 编码 化 的 意思 。 

编码 化 的 forwarding 指针 的 结构 如 图 13.16 所 示 。 














TE 

















32 22.21 | 





图 13.16 ”编码 化 的 forwarding 指针 的 结构 


32 位 的 编码 化 的 forwarding 指针 内 部 存 有 两 种 信息 。 


。 目 标 空间 地 址 信息 
。map 地 址 信息 


下 面 就 按 顺 序 详 细 看 一 下 这 两 种 信息 吧 
13.7.3 _ 目标 空间 地 址 信息 
编码 化 的 forwarding 指针 内 的 目标 空间 地 址 信息 的 详情 如 图 13.17 所 示 。 


32 2221 1 
rr 
目标 空间 地 址 信息 


图 13.17 forwarding 指 针 内 的 目标 空间 地 址 信息 





由 图 13.17 可 知 ， forwarding 偏 移 量 作为 日 标 空 间 地 址 信息 , 已 经 被 存 信 了 编码 化 的 
forwarding 指针 里 。 
关于 forwarding 偏 移 量 的 详细 情况 请 看 图 13.18。 


13.7 ”压缩 阶段 


内 存 空间 (老年 代 空 间 ) 








forwarding 偏 移 量 


A 
目标 空间 
不 : 















































页 面 内 开头 的 原 空间 对 象 
已 经 标记 完毕 


的 对 象 





图 13.18 forwarding 偏 移 量 


首先 把 复制 对 象 设 为 对 象 C,， 把 含有 对 象 C 的 页 面 内 (页 面 0) 开 头 的 对 象 设 为 B。 
forwarding 偏 移 量 指 的 是 对 象 C 的 目标 空间 地 址 Y 和 对 象 B 的 目标 空间 地 址 X 之 间 的 偏 移 量 。 

然后 给 老年 代 空 间 内 大 型 对 象 空间 以 外 的 那些 内 存 空 间 分 配 以 8K 字 节 为 单位 的 页 面 ， 
往 这 些 页 面 里 分 配对 象 ( 参 考 13.3.6 节 )。 另 外 ， 页 面 的 header 里 有 mc_first_forwarded 这 
个 域 ， 往 这 个 域 里 存 和 页面 内 开头 的 已 标记 对 象 的 目标 空间 地 址 。 

总 的 来 说 ，forwarding 偏 移 量 是 按照 如 下 方法 计算 的 。 











(页 面 内 开头 的 已 标记 对 象 的 目标 空间 地 址 一 目标 空间 地 址 ) >> 2 








最 后 向 右 偏 移 2 个 位 ， 对 象 的 大 小 肯定 会 是 4 的 倍数 (因为 是 按照 4 的 倍数 对 齐 的 )， 偏 
移 的 低 2 位 则 是 0o。 因 此， 在 这 里 需要 删除 用 不 着 的 低 2 位 。 

这 样 一 来 ，forwarding 偏 移 量 就 只 保留 了 11 位。 也 就 是 说 ， 这 能 保证 上 述 计 算 结 
(forwarding 偏 移 量 ) 在 11 位 以 内 。 下 面 来 一 起 试 着 确认 一 下 ， 看 forwarding 偏 移 量 的 最 大 值 
是 否 能 保证 在 11 位 以 内 。 

从 forwarding 偏 移 量 的 计算 过 程 来 看 ， 计 算是 从 某 页 面 内 的 对 象 的 目标 空间 地 址 减 去 同 
一 页 面 内 的 开头 对 象 的 目标 空间 地 址 。 也 就 是 说 ，forwarding 偏 移 量 不 可 能 超过 页 面 大 小 。 
页 面 大 小 是 8SK 字 节 。 为 了 计算 已 经 将 其 向 右 偏 移 了 2 个 位 ， 所 以 forwarding 偏 移 量 的 最 大 
值 是 2K 字 节 。2K 字 节 正好 在 11 位 的 范围 之 内 。 因 此 只 要 为 forwarding 偏 移 量 保留 11 位 就 
没 问 题 。 


13.7.4。_map 地 址 信息 
map 地 址 信息 是 把 对 象 所 持 有 的 map 地 址 编码 化 的 产物 。 大 家 还 记得 吧 ，map 地 址 指 的 
是 指向 那些 持 有 对 象 的 型 信息 的 map 对 象 的 指针 。 
编码 化 的 forwarding 指针 内 的 map 地 址 信息 如 图 13.19 所 示 。 
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32 22 21 10:9 1 


forwarding 偏 移 量 map 偏 移 量 map 页 面 索 




















目标 空间 地 址 信息 map 地 址 信息 


13.19 forwarding 指针 内 的 map 地 址 信息 








map 地 址 信息 和 目标 空间 地 址 信息 不 同 ， 它 是 以 两 个 值 为 基础 构成 的 。 


。map 页 面 索引 
。map 偏 移 量 








在 老年 代 空 间 的 内 存 空间 里 ,每 个 页 面 都 按照 页 面 链 表 的 排列 顺序 被 赋予 了 编号 (如 图 
13.20 里 的 页 面 0 等 ) map 页 面 索引 里 就 存储 着 那些 有 map 对 象 的 页 面 的 编号 。 

另外 ，map 偏 移 量 是 将 从 有 map 对 象 的 页 面 的 开头 到 map 对 象 的 俩 移 量 右 移 2 个 位 得 出 
的 值 。 显 而 易 见 ， 右 移 的 计算 方法 和 计算 forwarding 偏 移 量 的 方法 相同 。 




















老年 代 指 针 空间 〈 老 年代 空间 ) Map 空间 (老年 代 空间 ) 
map 偏 移 量 




















































































































页 面 0 页 面 0 | 
map 
人 为 复制 对 象 区 向 让 map 对 象 
的 对 象 : k 


图 13.20 ”map 页面 索引 & 偏 移 量 





这 样 一 来 就 保证 了 map 地 址 信息 在 21 位 ， 接 下 来 就 让 我 们 来 确认 一 下 map 地 址 信息 是 
不 是 在 21 位 以 内 吧 。 

已 知 保证 了 map 页 面 偏 移 量 在 11 位 。11 位 的 最 大 值 是 2K 字 节 ， 页 面 大 小 是 8K 字 节 。 
因为 将 其 右 移 2 位 就 会 变 成 2K 字 节 ， 所 以 不 要 紧 。 

已 知 保证 了 map 页 面 索 引 在 10 位 。 用 10 位 能 表示 的 范围 是 0~ 1023。 因 此 map 页 面 索 
引 能 将 页 面 编号 表示 到 1023。Map 空间 的 上 限 固定 为 8M 字 节 (1024 x 8K 字 节 )， 也 就 是 说 
Map 空间 内 的 最 大 页 面 编 号 是 1023， 属于 map 页 面 索引 的 范围 之 内 。 

综 上 ， 只 要 保证 map 地 址 信息 在 21 位 就 没有 问题 。 





W 


















































13.7.5 _ EncodeForwardingAddresses() 
负责 设 定 forwarding 指针 的 是 成 员 函 数 EncodeForwardingAddresses(), 其 调用 图 如 代码 
清单 13.2 所 示 。 
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代码 清单 13.2: EncodeForwardingAddresses() 的 调用 图 


EncodeForwardingAddresses() 
































EncodeForwardingAddressesInPagedSpace() 一 一 取出 内 存 空间 的 各 个 页 国 
EncodeForwardingAddressesInRange() 一 一 取出 页 面 内 的 对 象 
MCAllocateFrom0ldPointerSpace() 一 一 决定 日 标 空间 地 址 
EncodeForwardingAddressInPagedSpace() 一 一 设 定 forwarding 指针 
EncodeAddress() = 生成 编码 化 的 forwarding 指 针 


下 面 来 一 起 看 一 下 成 员 函 数 EncodeForwardingAddresses() 的 内 容 吧 。 本 章 中 虽然 只 介 
绍 如 何 设 定 老年 代 指 针 空间 的 forwarding 指针 ， 不 过 对 其 他 内 存 空 间 来 说 ， 需 要 执行 的 操作 
基本 上 也 是 一 致 的 。 








src/mark-compact.cc 


1251 | void MarkCompactCollector::EncodeForwardingAddresses() { 





/* 设 定 老 年 代 指针 空间 的 forwarding 指 针 */ 

1259 EncodeForwardingAddressesInPagedSpace<MCAllocateFrom0ldPointerSpace, 
1260 IgnoreNonLive0bject>( 

1261 Heap::old_pointer_space()) ; 





/* 省 略 : 老年 代 空 间 内 其 他 内 存 空间 的 forwarding 指 针 的 设 定 操作 */ 








1295 | 上 





在 这 里 把 老年 代 指 针 空 间 (01dSpace 类 的 实例 ) 传 递 给 EncodeForwardingAddressesInPag 
edSpace()o 

在 第 1259 行 把 成 员 函数 MCAllocateFrom0ldPointerSpace() 指定 为 模板 参数 ， 其 定义 如 
下 所 示 。 


src/mark-compact.cc 


963 | inline Object* MCAllocateFrom0ldPointerSpace(Heap0bject* ignore, 


964 int object_size) { 
965 return Heap::0ld_pointer_space()->MCAllocateRaw (object_size); 
966 |} 


在 第 965 行 调用 了 01dSpace 类 的 成 员 函 数 MCAllocateRaw()， 它 负责 把 参数 中 指定 的 大 小 从 
内 存 空 间 的 开头 (页 面 的 开头 ) 开始 按 顺序 不 间断 地 分 配 。 这 就 是 用 于 设 定 forwarding 指针 的 分 
配 右 。 

为 在 之 后 介绍 的 EncodeForwardingAddressesInRange() 中 还 会 用 到 上 述 函 数 ， 所 以 大 
家 只 要 理解 一 下 其 大 概 情况 就 行 。 
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src/mark-compact.cc 


1109 
1110 
二 于 二 二 
二 和 2 
1113 
1114 
1115 


1118 
1119 
1120 
二 下 2 二 
22 
| 123 
1124 
1125 
1126 





template<MarkCompactCollector: :AllocationFunction Alloc, 
MarkCompactCollector: :ProcessNonLiveFunction ProcessNonLive> 
void MarkCompactCollector: :EncodeForwardingAddressesInPagedSpace(l 
PagedSpace* space) { 
PageIterator it(space, Pagelterator::PAGES_IN_USE); 
while (it.has_next()) { 
Page* p = it.next(); 


int offset = 0; 
EncodeForwardingAddressesInRange<Alloc, 
EncodeForwardingAddressInPagedSpace, 
ProcessNonLive>( 
p->0bjectAreaStart (), 
p->AllocationTop(), 
&offset); 


最 后 用 EncodeForwardingAddressesInPagedSpace() 把 传递 给 参数 的 space (内 存 空间 ) 
内 的 页 面 一 个 个 取出 来 ,将 页 面 的 开头 和 结尾 地 址 ， 以 及 offset 的 指针 传递 给 EncodeForwa 
rdingAddressesInRange()o 大 家 请 记 住 ， 此 时 的 offset 为 0。 


13.7.6 EncodeForwardingAddresseslnRangeO) 
EncodeForwardingAddressesInRange() 负责 把 指定 范围 内 的 对 象 一 个 个 取出 来 ， 设 定 
forwarding 指针 。 在 此 展开 一 部 分 函数 内 的 模板 来 为 大 家 介绍 。 





src/mark-compact.cc 


1044 
1045 
1046 
1052 
1053 
1057 
1058 
1059 
1060 
1061 
1062 
1063 
1065 
1066 





inline void EncodeForwardingAddressesInRange(Address start, 
Address end, 
int* offset) { 
Address free_start = NULL ; 


bool is.prev_alive = true; 


int object. size; 
for (Address current = start; current < end; current += object_size) { 
Heap0bject# object = Heap0Object::FromAddress(current); 
if (object->IsMarked()) { 
object->ClearMark() ; 


object_size = object->Size(); 


Dbject* forwarded = MCAllocateFrom0ldPointerSpace(object, object_size); 
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EncodeForwardingAddressInPagedSpace(object, object_size, 
forwarded, offset); 
1082 } else { 
1083 object_size = object->Size(); 
1089 } 
1090 上 
1094 | } 





当 对 象 被 标记 完毕 的 时 候 ， 在 第 1063 行 消去 标记 。 

然后 调用 MCA1locateFrom01qPointerSpace()， 获取 forwarded (对象 的 目标 空间 地 址 )。 

接着 在 成 员 子 数 EncodeForwardingAddressesInPagedSpace() 内 生成 编码 化 的 forwarding 
指针 ， 并 将 其 存 入 object 的 map 域 里 。 


13.7.7 “EncodeForwardingAddresslInPagedSpaceb 


成 员 琢 数 EncodeForwardingAddressInPagedSpace() 的 参数 如 下 所 示 。 





对 象 的 原 空间 地 址 

对 象 大 小 

对 象 的 目标 空间 地 址 
指向 forwarding 偏 移 量 的 指针 


。 old_object 





。 object_size 





。 new_object 





。 offset 


在 这 个 成 员 函 数 内 第 一 次 调用 EncodeForwardingAddressInPagedSpace() 时 ，#offset 为 0。 


src/mark-compact.cc 


1005 | inline void EncodeForwardingAddressInPagedSpace(HeapObject*x old_object, 


1006 int object_size， 
1007 Object* new_object, 
1008 int* offset) { 

1010 if (*offset == 0) { 

014 Page: :FromAddress(old_object->address())->mc_first_forwarded = 
1012 Heap0bject::cast (new_object)->address(); 

1013 上 

1014 


1015 MapWord encoding = 

1016 MapWord: :EncodeAddress(o1d_object->map()->address() ，#offset) ; 
1017 old_object->set_map_word(encoding) ; 

1018 *offset += object_size; 





1020 | 上 
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*offset 为 0， 也 就 是 说 old_object 征 页 面 内 开头 的 已 标记 对 象 的 地 址 。 因 此 在 第 1011 行 
把 页 面 header 里 的 mc_first_forwarded 设 为 目标 空间 地 址 。 成 员 函 数 FromAddress() 负责 从 对 
象 的 地 址 获取 那些 有 对 象 的 页 面 的 地 址 。 在 第 1012 行 调用 成 员 函 数 adadress() ， 它 负责 从 指 
针 除 去 Heap0Object 的 标签 ， 返回 正确 的 地 址 。 

第 1016 行 负责 调用 成 员 哨 数 EncodeAddress()， 生成 编码 化 的 forwarding 指针 。 关 于 
EncodeAddress() 的 详细 内 容 我 们 会 在 后 面 介绍 。 

然后 只 要 把 用 MapWord: :EncodeAddress() 生成 的 编码 化 的 forwarding 指针 存 入 map 域 ， 
forwarding 指针 的 设 定 就 结束 了 。 

最 后 在 第 1018 行将 *offset 偏 移 对 象 大 小 , 在 设 定 同一 页 面 内 的 下 一 个 对 象 的 
forwarding 指针 时 ， 会 使 用 到 已 偏 移 的 xoffset。 

那么 一 起 来 看 一 下 用 于 生成 编码 化 的 forwarding 指针 的 EncodeAddress() 吧 。 在 此 展开 
了 一 部 分 在 成 员 函 数 内 使 用 的 常量 。 








src/mark-compact.cc 


922 | MapWord MapWord: :EncodeAddress(Address map_address, int offset) { 
int compact_offset = offset >> 2; 

Page* map_page = Page::FromAddress (map_address); 

int map_page_offset = map_page->0ffset (map_address) >> 2; 


uintptr_t encoding = 
(compact_offset << 21) | 
(map_page_offset << 10) | 
(map_page->mc_page_index << 0); 

941 return MapWord(encoding); 

942 | 上 





EncodeAddress() 把 map 地 址 (map_address ) 和 forwarding 偏 移 量 (offset ) 作为 参数 。 

首先 把 offset 右 移 2 个 位 ， 将 得 到 的 值 存 人 compact_offset。 

然后 由 map_address 计算 map_page ( 存 有 map_address 的 页 面 )， 之 后 使 用 map_page 的 
成 员 变 量 offset () ， 求 出 从 页 面 开 头 的 偏 移 量 ， 将 结果 存 和 人 map_page_offset。 

最 后 把 编码 化 的 forwarding 指针 存 和 人 encoding， 将 其 变换 成 MapWord 类 ， 返 回调 用 方 。 


13.7.8 (2) 更 新 指针 


这 里 的 “更 新 指针 ”就 是 把 VM Heap 内 的 各 个 对 象 所 持 有 的 指向 子 对 象 的 指针 ， 以 及 指 
向 根 的 指针 更 新 到 各 自 的 目标 空间 地 址 。 
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执行 更 新 指针 操作 的 是 UpdatePointers() ， 其 调用 图 如 代码 清单 13.3 所 示 。 


代码 清单 13.3: UpdatePointers() 的 调用 图 


UpdatePointers() 











IterateLive0bjects() 一 一 取出 活动 对 象 
UpdatePointersIn01d0bject() 
IterateBody() 一 一 取出 对 象 内 的 指针 
UpdatePointer() 更 新 指针 
GetForwardingAddressIn01dSpace() 获得 目标 空间 地 址 

















下 面 来 一 起 看 看 成 员 函 数 UpdatePointers() 吧 。 


src/mark-compact.cc 


1445 | void MarkCompactCollector::UpdatePointers() { 
/* 省 略 : 更 新 根 的 指针 的 操作 */ 


1456 int live_pointer_olds = IterateLive0bjects(Heap::old_pointer_space() ， 
1457 &UpdatePointersIn01d0bject) ; 





/* 省 略 : 更 新 其 他 内 存 空间 内 对 象 的 指针 的 操作 */ 





1483 | 上 


第 1456 行 的 成 员 函 数 IterateLive0bjects() 对 内 存 空间 内 的 所 有 活动 对 象 调 用 作为 参数 的 
成 员 函 数 。 这 里 调用 的 是 成 员 隐 数 UpdatePointersIn01d0bject()。 虽 然 本 章 中 只 介绍 “老年 代 
指针 空间 的 指针 更 新 "， 不 过 对 其 他 内 存 空间 而 言 ， 要 执行 的 操作 基本 是 相同 的 。 

此 外 , 之 前 在 13.6.3 节 中 讲 过 HandleScope 等 内 容 , 更 新 根 的 指针 , 也 就 是 更 新 
HandleScope 管理 的 那些 指针 。 指 针 的 更 新 方法 也 和 在 本 章 中 讲解 的 老年 代 指针 空间 的 指针 
的 更 新 方法 基本 相同 ， 因 此 这 里 不 再 歼 述 。 






































src/mark-compact.cc 


1515 | int MarkCompactCollector: :UpdatePointersIn0ldObject(HeapObject* obj) { 
/* 省 略 : map 地 址 的 更 新 操作 */ 


1540 UpdatingVisitor updating_visitor; 

1541 obj->IterateBody(type, obj_size, &updating_visitor); 
1542 return obj_size; 

1543 | } 
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在 这 里 使 用 成 员 函 数 UpdatePointersIn01d0bject() 更 新 那些 被 传递 给 参数 的 对 象 的 指针 。 
第 1541 行 的 TterateBody() 是 在 13.6 节 中 屡次 出 现 过 的 成 员 函 数 ， 大 家 应 该 还 有 印象 吧 。 这 个 
成 员 函 数 负 责 把 指针 群 交 给 visitor。visitor 使 用 用 于 更 新 指针 的 UpdatingVisitor 类 。 


13.7.9 UpdatingVisitor 
作为 指针 更 新 对 象 的 那些 对 象 内 的 指针 群 的 开头 和 结尾 地 址 会 被 传递 给 UpdatingVisitor 类 


的 VisitorPointerso 





Src/mark-compact.cc 
1367 | class UpdatingVisitor: public 0bjectVisitor { 
1368 | public: 


1973 void VisitPointers(0bject** start, Object** end) { 
4975: for (Object** p = start; p < end; p++) UpdatePointer(p); 
1376 了 


1386 | Private : 
1387 void UpdatePointer(Object** p) { 





1388 if (!(*p)->IsHeapObject()) return; 

1389 

1390 Heap0bject# obj = HeapObject::cast(*p); 

1427 new_addr = MarkCompactCollector::GetForwardingAddressIn0ldSpace (obj); 
1432 

1433 *p = HeapObject::FromAddress (new_addr); 

1441 了 

1442 | }; 

















最 后 把 对 象 内 的 各 个 指针 域 地 址 传递 给 成 员 函 数 UpdatePointers()。 这 个 成 员 函 数 是 指 
针 更 新 操作 的 核心 部 分 。 

成 员 隐 数 GetForwardingAddressIn0ldSpace() 负责 把 编码 化 的 forwarding 指针 解密 ， 并 
返回 目标 空间 地 址 。 我 们 会 在 接 下 来 的 13.7.10 节 为 大 家 解释 这 个 函数 。 

在 第 1433 行 , 通过 成 员 子 数 FromAddress() 给 上 日 标 空间 地 址 new_address 打 上 
Heap0bject 的 标签 ， 将 其 返回 值 存 入 xp， 以 此 来 更 新 对 象 的 指针 。 执 行 指针 的 更 新 操作 的 


正 是 这 一 行 。 


13.7.10 GetForwardingAddressInOIldSpace(0 
GetForwardingAddressIn01dSpace() 是 把 编码 化 的 forwarding 指针 解密 ， 返 回 目 标 空间 
地 址 的 成 员 函 数 。 
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src/mark-compact.cc 


1546 


1548 


1551 


1552 


1555 


1556 


1559 


1560 


1563 
1564 





Address 
MarkCompactCollector: :GetForwardingAddressIn0ldSpace(Heap0bject* obj) { 
MapWord encoding = obj->map_word(); 





/* 获取 forwarding 偏 移 量 */ 
int offset = encoding.Decode0ffset(); 


Address obj_addr = obj->address(); 
Page* p = Page::FromAddress (obj_addr); 








/* 获取 位 于 原 空间 页 面 开 头 的 已 标记 对 象 的 目标 空间 地 址 */ 


Address first_forwarded = p->mc_first_forwarded; 


























/* 获取 开头 对 象 的 目标 空间 页 面 */ 


Page* forwarded_page = Page::FromAddqress (first_forwarded) ; 





























/* 从 开头 对 象 的 目标 空间 地 址 的 页 面 开头 开始 的 侦 移 量 */ 


int forwarded_offset = forwarded_page->0ffset(first_forwarded) ; 




















/* 开头 对 象 的 目标 空间 页 面 内 最 后 的 预定 复制 地 址 */ 
Address mc_top = forwarded_page->mc_relocation_top; 


int mc_top_offset = forwarded_page->0ffset (mc_top); 











/* 是 否 在 页 面 范 围 内 ? */ 
if (forwarded_offset + offset < mc_top_offset) { 





vreturn first_forwarded + offset; 


有 


/* 下 一 个 页 面 */ 


Page* next_page = forwarded_page->next_page() ; 


offset -= (mc_top_offset - forwarded_offset); 
offset += Page::kObjectStartoffset ; 


return next_page->0ffsetToAddress(offset) ; 





第 1551 行 的 Decode0ffset() 是 从 编码 化 的 forwarding 指针 取出 forwarding 偏 移 量 的 成 
第 1563 行 的 mc_relocation_top 是 被 预定 为 forwarded_page 最 靠 后 的 目标 空间 的 地 址 。 也 
就 是 说 ， 如 果 obj 的 目标 空间 地 址 超过 了 mc_relocation _top， 那么 人 forwarded_page 的 下 一 个 页 

















面 就 会 











是 目标 空间 页 面 。obj 的 目标 空间 地 址 指 着 下 一 个 页 面 时 的 示意 图 如 图 13.21 所 示 。 
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内 存 空 间 (老年 代 空间 ) 








mce_relocation top 


first_forwarded 

































目标 空间 


















































页 面 内 开头 的 obj 
已 标记 完毕 的 
对 象 


图 13.21 目标 空间 地 址 指 着 下 一 个 页 面 时 的 情况 


如 果 日 标 空 间 地 址 位 于 比 mc_relocation_top 还 低 的 地 址 就 给 first_forwarded ( 开头 
对 象 的 目标 空间 地 址 ) 加 上 offset， 并 返回 这 个 值 (第 1570 行 )。 

另 一 方面 ， 如 果 目 标 空间 地 址 位 于 比 mc_relocation_top 更 高 的 地 址 ， 就 说 明 forwarded_ 
page 的 下 一 个 页 面 里 有 目标 空间 地 址 。 因 此 从 mc_top_offset 里 减 去 forwarded_offset， 加 
上 Page::k0bjectStart0ffset( 页 面 的 header 大 小 ), 求 出 从 下 一 个 页 面 开 头 到 目标 空间 地 
址 的 偏 移 量 (offset), 然后 在 第 1583 行 把 offset 传递 给 0ffsetToAddress()。 第 1583 行 的 
0ffsetToAddress() 正如 其 名 ， 是 一 个 把 从 页 面 开 头 开 始 的 偏 移 量 转 换 成 地 址 的 成 员 函 数 。 


13.7.11 (3) 移 动 对 象 
这 里 的 “移动 对 象 ” 就 是 按照 YM Heap 内 的 各 个 对 象 被 设 定 的 forwarding 指针 (目标 空 
间 地 址 ) 来 实际 移动 对 象 。 
执行 移动 对 象 操 作 的 是 成 员 画 数 Relocate0bjects()。 

















src/mark-compact.cc 


1590 | void MarkCompactCollector::Relocate0bjects() { 


1598 int live_pointer_olds = IterateLive0bjects(Heap::old_pointer_space() ， 
1599 &Relocate01dPointerObject) ; 











/* 省 略 : 其 他 内 存 空间 内 对 象 的 移动 操作 */ 








1634 | 
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困 数 的 内 容 和 UpdatePointers() 基本 一 致 ， 只 是 传递 给 IterateLive0bjects() 的 函数 
指针 不 同 而 已 。 
这 里 把 成 员 函 数 Relocate01dPointer0bject() 传递 给 了 IterateLive0bjects()， 下面 一 


起 来 看 看 其 内 容 吧 。 


src/mark-compact.cc 
1718 | int MarkCompactCollector::Relocate01dPointer0bject(Heap0bject# obj) { 
1719 return Relocate01dqNonCode0bject(obj，Heap::old_pointer_space()) ; 
1720 | 上 


1693 | int MarkCompactCollector::Relocate01dNonCode0bject(HeapObject# obj ， 
1694 PagedSpace* space) { 
1696 MapWord encoding = obj->map_word(); 

1697 Address map_addr = encoding.DecodeMapAddress (Heap: :map_space()); 

1699| /* 获取 目标 空间 地 址 */ 

1701 Address new_addr = GetForwardingAddressIn0ldSpace(obj); 

1702 | /* 设 定 map 地 址 、 获 取 对 象 大 小 */ 

1704 int obj_size = RestoreMap(obj, space, new_addr, map_addr); 

1705 
1706 Address old_addr = obj->address(); 
1707 
1708 if (new_addr != old_addr) { 

1709 memmove (new_addr，old_addr，obj_size); // 移动 对 象 
二 7 二 0 上 

1713 




















1714 return obj_size; 


1715|} 





Relocate01dPointer0bject() 在 内 部 调用 Relocate01dNonCode0bject()。 

成 员 函 数 Relocate01dNonCode0bject() 的 内 容 并 没有 那么 难 。 第 1704 行 的 RestoreMap() 
函数 是 负责 给 map 域 设 定 map_addr,， 并 返回 对 象 大 小 。 之 后 从 old_addr( 原 空间 地 址 ) 把 
obj_size (对象 大 小 ) 的 量 memmove() 到 new_addr (目标 空间 地 址 ) 


13.7.12 (4) 更 新 记录 集 


V8 的 垃圾 回收 是 分 代 垃圾 回收 ， 因 此 V8 里 有 负责 记录 从 老年 代 空间 到 新 生 代 空 间 引用 
的 记录 集 。 在 这 一 节 中 我 们 将 为 大 家 说 明 如 何 更 新 这 个 记录 集 。 

首先 为 大 家 说 明 的 是 为 什么 需要 更 新 记录 集 。 

当然 更 新 记录 集 的 原因 之 一 就 是 对 象 通过 压缩 被 移动 ， 记 录 集 内 的 地 址 变 成 了 “ 旧 的 信息 ” 
( 即 移动 前 的 地 址 )。 不 过 除了 这 个 ， 还 有 其 他 两 个 原因 。 
通过 写 入 屏障 ， 从 老年 代 空 间 到 新 生 代 空间 的 引用 会 被 记录 到 记录 集 。 但 是 V8 的 写 入 
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屏障 虽然 会 往 记 录 集 里 记录 ， 但 不 会 消除 记录 。 把 指向 新 生 代 空 间 内 对 象 的 指针 存 到 老年 代 
空间 内 的 指针 域 ， 并 通过 写 人 屏障 将 其 记录 到 记录 集 后 ， 即 使 在 这 个 指针 域 里 放 入 其 他 任何 值 ， 
记录 集 的 记录 都 不 会 被 消除 。 也 就 是 说 ， 如 果 不 在 某 个 时 候 更 新 记录 集 内 的 记录 的 话 ， 记 录 
集 就 会 持续 增 大 。 

因此 ， 我 们 在 GC 时 会 将 所 有 记录 集 清空 一 次 ,重新 把 指向 新 生 代 空间 的 指针 域 记 录 到 
记录 集 里 。 


13.7.13 ”记录 集 的 结构 
记录 集 被 作为 位 图 表格 配置 在 了 各 个 页 面 的 header 部 分 (图 13.22)。 



































页 面 (8K 字 节 ) 


对 应 对 象 











; 记录 集 
1 的 域 1 (位 图 表格 ) 
对 象 1 
分 配对 象 的 空间 





1 个 字 


图 13.22 ”记录 集 ( 位 图 表格 ) 的 结构 





这 里 的 位 图 表格 的 用 法 和 第 11 章 中 介绍 的 位 图 标记 几乎 一 样 。 记 录 集 内 的 各 个 位 和 页 
面 内 的 域 ( 如 果 CPU 是 32 位 的 ， 则 对 应 4 个 字 节 ) 相 对 应 。 一 旦 设立 记录 集 内 的 位 ， 跟 位 对 
应 的 域内 就 存 入 了 指向 新 生 代 空 间 的 指针 (图 13.23 )。 

此 外 ， 通 过 以 下 计算 还 可 以 求 出 位 图 表格 的 大 小 。 




















8 区 字 节 (页 面 大 小 )/4 字 节 ( 指 针 大 小 ) = 二 2048 (页 面 的 最 大 域 数量 ) 
2048/8( 1 字 节 中 的 位 数 ) 二 256 字 节 
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| 1 | 设立 标志 位 





新 生 代 空间 

















图 13.23 ”把 指向 新 生 代 空间 的 引用 记录 到 记录 和 集 里 

















如 果 记 录 集 的 大 小 是 256 字 节 ， 那 么 就 可 以 网 罗 页 面 内 所 有 的 指针 域 了 (在 32 位 CPU 
的 情况 下 )。 


13.7.14 RebuildRSets() 
下 面 来 看 一 下 负责 更 新 记录 集 的 成 员 函 数 RebuildRSets() 吧 。 





src/mark-compact.cc 


1801 | void MarkCompactCollector::RebuildRSets() { 
1806 Heap: :RebuildRSets(); 
1807 | 上 


在 内 部 调用 Heap 类 的 成 员 函 数 RebuildRSets()。 


Src/heap.cc 


857 | void Heap::RebuildRSets() { 


860 map_space_->ClearRSet() ; 
861 RebuildRSets (map_space_) ; 
862 
863 old_pointer_space_->ClearRSet() ; 





864 RebuildqRSets(old_pointer_space_) ; 
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865 

866 Heap::1o_space_->ClearRSet() ; 
867 RebuildRSets(1o_space_) ; 

868 | 上 


只 有 那些 具有 指向 新 生 代 空间 的 引用 的 内 存 空间 才 有 记录 集 。 


。Map 空间 (map_space_) 
。 老 年 代 指 针 空 间 ( old_pointer_space_) 
。 大 型 对 象 空间 ( lo_space_) 





另外 ， 记 录 集 的 更 新 方法 基本 上 不 会 因 空间 不 同 而 有 所 差别 。 这 里 以 老年 代 指 针 空间 (old_ 
Pointer_space_ ) 为 例 ， 为 大 家 讲 一 下 如 何 更 新 记录 集 。 

第 863 行 的 成 员 函 数 clearRset () 被 用 来 销毁 记录 集 内 的 记录 。 因 为 记录 集 事实 上 是 个 
位 图 表格 ， 所 以 只 要 将 其 清 零 ， 就 能 清空 记录 集 。 这 是 非常 高 速 的 。 

第 864 行 调用 的 RebuildRsets() ( 重 载 炎 ) 是 用 来 重新 构建 记录 集 的 成 员 函 数 。 



































Src/heap.cc 
871 | void Heap::RebuildRSets(PagedSpace* space) { 
872 Heap0bjectIterator it(space); 
873 while (it.has_next()) Heap::UpdateRSet(it.next()); 
874 | 


在 第 873 行 对 内 存 空间 内 的 对 象 调用 成 员 函 数 UpdateRSet ()。 


Src/heap.cc 
831 | int Heap::UpdateRSet (HeapObject* obj) { 


850 UpdateRSetVisitor v; 
851 obj->Iterate(&v); 


853 return obj->Size(); 
854|} 





关于 第 831 行 的 成 员 函 数 UpdateRset () ， 我 们 把 多 余 的 部 分 省 略 掉 了 。 事 实 上 其 中 的 操 
作 内 容 只 是 把 UpdateRSetVisitor 类 的 visitor 传递 给 了 obj 的 Iterate() 而 已 。Iterate() 这 
员 


个 成 员 函 数 用 来 对 对 象 内 的 所 有 指针 域 调 用 visitor 的 VisitPointers() 或 VisitPointer()。 











GD 重 载 : 多 重 定 义 那 些 名 称 相同 但 返回 值 、 参 数 数量 和 类 型 不 同 的 函数 。 
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13.7.15 UpdateRSetVisitor 


UpdateRSetVisitor 类 的 内 容 非 常 简单 。 


Src/heap.cc 


804 | class UpdateRSetVisitor: public ObjectVisitor { 
805 | public: 


806 

807 void VisitPointer(Object** p) { 

808 UpdateRSet (p); 

809 } 

810 

811 void VisitPointers(0bject** start, Object** end) { 
815 for (Object** p = start; p < end; p++) UpdateRSet (p); 
816 } 

817| private: 

818 

819 void UpdateRSet (Object** p) { 

824 if (Heap::InNewSpace(*p)) { 

825 Page::SetRSet (reinterpret_cast<Address>(p), 0); 
826 } 

827 } 

828 | }; 





第 807 行 的 VisitPointer() 负责 接收 对 象 内 的 指针 域 地 址 ， 第 811 行 的 VisitPointers() 则 
负责 接收 对 象 指针 群 的 开头 地 址 和 结尾 地 址 。 这 两 个 成 员 函 数 都 只 是 在 内 部 调用 UpdateRSet () 。 

用 UpdateRSet() 检查 指针 域 里 面 是 不 是 新 生 代 空间 的 地 址 。 如 果 是 新 生 代 空间 的 地 址 ， 
就 必须 将 其 记录 到 记录 和 集 里 。 因 此 我 们 在 第 825 行 调用 SetRSet ()。 


13.7.16 SetRSet() 


成 员 函 数 SetRSet() 负责 往 记 录 集 里 记录 指向 新 生 代 空 间 的 引用 。 我 们 将 代码 内 的 一 部 
分 函数 展开 ， 如 下 所 示 。 






































src/spaces-inl.h 
148 | void Page::SetRSet(Address address, int offset) { 
149 uint32_t bitmask = 0; 
50 Address rset_address = ComputeRSetBitPosition(address, offset, &bitmask); 
*(reinterpret_cast<uint32_t*>(rset_address)) |= bitmask; 
154 | } 


第 150 行 的 ComputeRSetBitPosition() 返回 与 address 对 应 的 位 图 表格 列 的 地 址 ， 往 参 
数 bitmask 里 存 人 位 图 标记 。 位 图 标记 是 用 来 设置 与 address 对 应 的 位 的 。 
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下 面 一 起 来 看 看 成 员 函 数 ComputeRSetBitPosition() 的 定义 。 为 了 便于 说 明 ， 我 们 展开 
了 一 部 分 常量 。 
Src/spaces-inl.h 


112 | Address Page: :ComputeRSetBitPosition(Address address， 
E13 uint32_t* bitmask) { 


116 Page* page = Page::FromAddress(address); 
uint32_t bit_offset = page->0ffset(address) >> 2; 
*bitmask = 1 << (bit_offset % 32) ; 


Address rset_address = page->address() + (bit_offset / 32) * 4; 
144 return rset_address; 


145 | 了] 


取 从 页 面 开头 到 address 的 偏 移 量 ， 再 用 偏 移 量 除 以 指针 的 大 小 ， 然 后 拿 这 个 数 除 以 位 
图 表格 的 1 列 大 小 的 位 数 求 出 余数 ， 最 后 把 1 向 左 移 ， 左 移 的 量 等 于 这 个 余数 。 
至 于 rset_address (对 应 address 的 位 图 表格 的 列 的 地 址 )， 可 以 用 bit_offset 除 以 位 
图 表格 1 列 大 小 的 位 数 ， 再 乘 以 位 图 表格 1 列 大 小 的 字 节 数 ， 然 后 将 得 到 的 结果 与 页 面 开头 
地 址 相 加 就 可 以 求 出 来 了 。 

之 后 只 要 计算 rset_address 跟 bitmask 的 逻辑 或 (OR), 并 将 结果 存 入 在 rset_address 内 的 
位 列 即 可 (图 13.24)。 
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图 13.24 ”在 位 图 表格 的 列 中 对 bitmask 执 行 逻辑 或 操作 





这 样 就 成 功 地 把 指向 新 生 代 空间 的 引用 记录 到 记录 集 里 了 。 





13.8 Q&A 431 


13.8 


13.8.1 ” 听 说 V8 是 在 Android 平 台 上 运行 的 ， 是 这 样 吗 ? 


V8 是 Chrome (Web 浏览 需 ) 的 JavaScript 引擎 。 现 在 Android 虽然 搭载 着 其 他 非 Chrome 
的 Web 浏览 器 ， 不 过 将 来 可 能 会 将 其 替换 成 Chrome (因为 V8 和 Android 都 是 Google 公司 的 
产品 )。 

因此 ，V8 是 为 将 来 能 在 Android 平台 上 运作 而 设计 的 。 笔 者 写作 本 书 时 虽然 还 没有 消息 
说 V8 已 经 完全 能 在 Android 平台 上 运作 了 ,不 过 大 家 在 源 代码 内 可 以 看 到 一 些 用 于 Android 
的 描述 。 

在 Android 平 台 上 运行 V8, 或 者 进一步 说 在 Android 平台 上 运行 Chrome 的 那 一 天 应 该 
不 远 了 。 

13.8.2 ”终结 器 是 什么 ? 


在 V8 所 遵循 的 JavaScript 的 规格 (ECMAScript 3rd Edition ) 中 ， 对 象 是 没有 终结 器 的 。 
也 就 是 说 ， 在 语言 规格 方面 是 没有 终结 需 的 。 因 此 V8 的 代码 内 没有 任何 关于 对 象 终结 器 的 



























































操作 。 
这 个 规格 令 GC 实现 者 大 为 欢心 。 因 为 对 他 们 来 说 ,问题 一 旦 涉及 终结 器 就 会 变 得 非常 
为 手 。 


不 过 从 语言 使 用 者 的 角度 来 说 ， 没 有 终结 器 或 许 会 很 不 好 受 吧 。 





这 里 笔者 将 为 大 家 补充 一 些 内 容 ， 包 括 “ 实现 篇 ”中 未 讲解 的 语言 的 简单 说 明 等 。 





由 三 站 简单 语言 入 门 : Python 篇 
Python 由 Guido van Rossum 开发 ， 是 一 种 有 着 动态 类 型 的 面向 对 象 的 脚本 语言 。 
内 置 数据 类 型 
内 置 数据 类 型 是 Python 中 一 开始 就 构建 了 的 类 型 ， 它 向 用 户 提供 字符 串 和 列表 等 一 般 
的 功能 。 
在 此 为 大 家 介绍 几 个 具有 代表 性 的 内 置 数据 类 型 ， 分 别 是 数值 型 、 序 列 型 、 映 射 型 。 
数值 型 


Python 中 有 整 型 、 浮 点 型 以 及 复数 类 型 这 三 种 不 同 的 数值 类 型 。 
在 Python 中 它们 分 别 如 下 所 示 。 























附录 A 简单 语言 人 门 : Python 篇 433 


1 # 整 型 
0.1 # 浮 点 型 
1j # 复 数 类 型 




















在 Python 中 没有 Java 中 的 int 和 long 这 样 的 “基本 数据 类 型 "。 也 就 是 说 ，1 和 2 这 样 


的 整数 也 全 都 会 被 当成 对 象 来 处 理 。 
序列 型 





是 
[ 
字 


符 串 

















序列 型 是 处 理 连 续 元 素 的 类 型 。 我 们 在 此 拿 出 几 个 具有 代表 性 的 序列 为 大 家 说 明 ， 分 别 


字符 串 、 列 表 和 元 组 。 

















字符 排列 成 的 串 叫 作 字符 串 。“ab” 这 个 字符 串 是 由 “a” 和 “b” 这 两 个 连续 的 元 素 (在 这 























里 是 字符 ) 构 成 的 。 也 就 是 说 ， 字 符 串 也 属于 序列 型 。 




















在 Python 中 是 这 样 来 表示 字符 串 的 。 


"字符 串 。 





此 外 ， 所 定义 的 字符 串 每 一 个 都 是 不 同 的 实例 。 
也 就 是 说 ， 像 下 面 这 样 重复 定义 的 话 ， 就 会 生成 不 同 的 字符 串 对 象 。 























"字符 串 。 
"字符 串 ， 
"字符 串 。 


列表 





对 字符 串 而 言 ， 连 续 的 元 素 是 字符 ; 但 对 列表 而 言 ， 所 有 对 象 都 可 以 作为 其 元 素 。 
列表 的 定义 如 下 所 示 。 

11st. = ET 人 人 

还 可 以 像 下 面 这 样 变 更 列表 的 元 素 。 

list = ['1', 'a', 's', 't!] 


list[1] = *E 
print (list) # => ['1', 'i', 's', 't'] 


代码 注释 中 的 => 部 分 表示 执行 结果 。 
在 往 列 表 中 追加 和 删除 元 素 的 时 候 ， 可 以 使 用 append 和 pop， 如 下 所 示 。 


434 附录 


了 8 
list.append('list') # 追加 

print (Listy) > 
list.pop() # 前 除 

print(list) #.=> ['L', "i", ®B", "tT] 


元 组 
元 组 也 和 列表 一 样 ， 可 以 将 所 有 对 象 作为 元 素 。 
元 组 的 定义 如 下 所 示 。 


tuple = ('t', 'u', 'p', '1', 'e') 








元 组 和 列表 虽然 很 像 ， 不 过 元 组 有 个 特征 ,就 是 一 旦 生成 了 元 组 ， 我 们 就 无 法 变更 它 。 





tuple 二 Ct Dy a ra 
tuple[0] = 'g' 


# TypeError: 'tuple' object does not support item assignment 





映射 型 
在 映射 型 中 可 以 把 无 法 变更 的 对 象 一 一 键 和 任意 的 对 象 对 应 。 现 在 映射 型 只 包括 一 种 类 型 ， 
即 字典 类 型 。 


字典 的 定义 如 下 所 示 。 


dict = {"cat" : " 猫 "， "dog" : " 狗 " 


























“cat ”的 部 分 是 键 ， 键 必须 是 无 法 变更 的 对 象 。 也 就 是 说 ， 不 能 把 列表 和 字典 当成 键 来 使 用 。 
我 们 可 以 把 键 作 为 索引 来 取出 添加 到 字典 的 对 象 。 











dict = {"cat" : " 猫 "， "dog" : " 狗 " 
dict["cat"] # => 猫 


状 


在 这 里 为 大 家 介绍 一 下 如 何 简 单 地 生成 类 和 实例 。 
类 的 定义 如 下 所 示 。 


# 开始 定义 类 


class Cat: 


# 构造 函数 
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def __init__(self, name): 


[a 


self .name = name # 设置 实例 变量 
# 定义 方法 
def hello(self): 


print(self.name + ": Nyan!") 
下 面 该 生成 实例 、 调 用 方法 了 。 


tama = Cat("Tama") # 生成 cat 类 的 实例 
tama.hello() # => "Tama : Nyan!" 


小 请 当 : 攻 简 单 语 言 入 门 : Java 篇 
Java 由 James Gosling 等 人 开发 ， 是 一 种 面向 对 象 的 强 静 态 类 型 语言 。 
基本 数据 类 型 和 引用 类 型 


Java 的 数据 类 型 大 体 上 可 分 为 两 种 ， 即 “基本 数据 类 型 ”" 和 “引用 类 型 ”。 
基本 数据 类 型 包括 布尔 型 poolean， 字 符 型 cnar， 整 型 byte、 short、 int、 long 以 及 学 
点 型 float 、double。 


引用 类 型 包括 数组 和 类 等 。 
数组 


数组 是 可 以 持 有 多 个 同一 类 型 数据 的 对 象 。 数 组 的 大 小 在 初始 化 时 就 已 经 被 定好 了 ， 之 
后 是 无 法 变更 的 。 











int intArray[] = new int[10]; 
String stringArray[] = new String[10]; // 字符 串 的 数组 





状 





类 的 定义 如 下 所 示 。 


开始 定义 类 
class Cat { 
// 实例 变量 


String name; 
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// 构造 函数 
Cat(String name) { 
this.name = name; 


} 


// 定义 方法 
public void hello() { 
System.out.println(this.name + ": Nyan!"); 


了 
上 


接 下 来 生成 实例 ， 并 调用 方法 。 
public static void main(String args[]) { 


Cat tama = new Cat("Tama"); // 生成 cat 类 的 实例 
tama.hello(); // => "Tama : Nyan!" 


小 上 32 叶 简单 语言 入 门 : Ruby 篇 
Ruby 由 松本 行 弘 开发 ， 是 一 种 面向 对 象 的 脚本 语言 。 
全 都 是 对 象 


整数 和 字符 串 等 全 都 是 Ruby 的 对 象 。 举 个 例子 ， 假 设 整数 对 象 里 已 经 定义 了 一 个 用 来 
返回 绝对 值 的 方法 abs()。 


1 # 整数 对 象 


-1.abs() # => 1 


状 





类 的 定义 如 下 所 示 。 


# 开始 定义 类 
class Cat 
# 构造 函数 
def initialize(name) 
@name = name # 设 定 实例 变量 


end 
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# 定义 方法 
def hello 

puts @name + ": Nyan!" 
end 


end 
接 下 来 生成 实例 ， 并 调用 方法 。 


tama = Cat.new("Tama") # 生成 Cat 类 的 实例 





tama.hello # => "Tama : Nyan!" 


在 Ruby 中 ， 如 果 调 用 方法 时 没有 指定 参数 的 话 ， 就 可 以 省 略 ()。 


澳 记忆 朋 简单 语言 入 门 : JavaScript 篇 


JavaScript 是 一 种 基于 原型 的 面向 对 象 的 脚本 语言 。 因 为 几乎 所 有 的 Web 浏览 右 都 搭载 
有 JavaScript 引擎 ， 所 以 大 家 应 该 都 比较 熟悉 它 了 吧 。 


基本 数据 类 型 和 引用 类 型 


JavaScript 的 数据 类 型 和 Java 一 样 ， 也 分 成 “基本 数据 类 型 ”和 “引用 类 型 ”。 
基本 数据 类 型 包括 布尔 型 、 字 符 串 、 数 值 、 未 定义 类 型 和 NULL 型 。 
引用 类 型 包括 对 象 和 函数 。 


对 象 


在 JavaScript 里 没有 类 这 个 概念 。 大 家 可 以 把 JavaScript 想象 成 一 个 只 有 实例 化 对 象 的 
世界 。 对 象 有 属性 和 方法 。 
我 们 按照 下 面 的 操作 来 生成 对 象 。 











var tama = {}; // 生成 对 象 

tama.name = "tama"; // 设 定 属性 

// 定义 方法 

tama.hello = function(){ alert(this.name + ": Nyan!") } 
// 调用 方法 


tama.hello(); 
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如 果 使 用 构造 函数 (函数 对 象 )， 就 能 更 加 简单 地 生成 对 象 。 


function Cat(name) { 

this.name = name; 

this.hello = function(){ alert(this.name + ": Nyan!"); }; 
内 





var tama = new Cat("tama"); // 使 用 cat 构 造 函数 生成 对 象 





tama.hello(); // => "Tama : Nyan!" 
试 着 创建 自己 的 GC 吧 


我 们 在 “实现 篇 ”中 介绍 的 GC 规模 都 很 大 。 实 用 层面 的 GC 很 复杂 ， 代 码 量 往往 会 非常 巨大 。 
因此 有 很 多 人 会 想 : 仅 赁 一 己 之 力 应 该 很 难 创 建 GC 吧 ?” 

不 过 如 果 不 考虑 效率 ， 单 纯 从 学 习 目 的 出 友 的 话 ， 实 际 上 要 创建 GC 是 很 容易 的 。 

笔者 试 着 生成 了 一 个 简单 的 保守 式 GC 库 ， 包 括 测试 在 内 总 共 做 了 450 行 。 笔 者 将 源 代码 命 
名 为 minigc， 上 传 到 了 github 上 。 

http://github.com/authorNari/minigc 

大 家 也 试 着 自己 来 创建 GC 吧 ! 这 样 不 但 有 助 于 加 深 理解 ， 还 能 深刻 体会 到 语言 搭载 的 GC 
有 多 私人 WM 于 





















































对 于 我 跟 相 川 来 说 ， 写 作 本 书 就 是 在 接受 不 间断 的 挑战 。 下 面 就 从 这 些 为 数 众 多 的 挑战 
中 选 出 几 个 介绍 给 大 家 ， 以 此 来 为 本 书画 上 句号 。 


1. 第 一 本 专门 讲解 GC 的 日 语 书 

本 书 是 第 一 本 专门 讲解 GC 的 日 语 书 。 对 我 们 来 说 ， 这 是 最 大 的 挑战 。 

此 外 ， 自 McCarthy 发 表 第 一 篇 关于 GC 的 论文 后 , 今年 刚好 是 第 50 个 年 头 。 在 时 隔 
GC 间 世 半 个 世纪 之 后 ， 本 书 得 以 出 版 ， 真 是 不 可 思议 的 缘分 。 而 有 幸 执 笔 本 书 ， 也 令 我们 


不 胜 悍 愁 。 
































2. 两 人 都 是 第 一 次 写 书 


两 位 笔者 都 是 第 一 次 写 书 。 刚 开始 时 大 家 都 抓 不 到 写作 的 节奏 ,非常 烦 间苗 恼 ( 虽 然 到 
最 后 也 不 能 说 抓 到 节奏 了 )。 话说 回来 ,我 们 虽然 苦恼 ,不 过 也 在 一 点 一 滴 地 努力 ， 并 在 写 
作 的 过 程 中 渐渐 找到 了 自信 ， 最 后 终于 完成 了 本 书 。 

另外 ， 共 同 创作 有 乐 也 有 苦 ， 头 一 次 知道 两 个 人 要 合拍 有 多 么 难 。 

为 了 将 本 书写 得 更 好 ， 我 们 进行 了 认真 的 讨论 。 重 新 读 一 遍 本 书后 ， 发 现 曾经 的 讨论 都 
是 个 性 的 融 汇 碰撞 ， 而 这 也 在 本 书 中 以 很 好 的 形式 体现 了 出 来 。 这 下 我 们 终于 可 以 自信 满 满 
地 说 :“ 这 本 书 只 有 我 们 两 个 人 才 写 得 出 来 !” 









































3. 算法 介绍 简明 易 懂 

“算法 篇 "里 用 到 了 很 多 图 示 ， 基 本 上 所 有 算法 都 是 用 伪 代 码 描述 的 。 内 容 之 简单 连 我 
自己 都 感叹 不 已 。 在 这 方面 ,“ 算 法 篇 ”的 执笔 者 相川 着 实 花费 了 一 番 苦 心 。 

如 果 各 位 读者 也 有 同样 的 感慨 ， 那 多 半 是 相川 的 功劳 。 











4. 用 源 代 码 写 故事 

在 后 半 部 分 的 “实现 篇 " 里， 我们 解读 了 实际 的 源 代码 。 源 代码 和 小 说 等 作品 不 一 样 ， 
它 的 写作 顺序 让 人 读 起 来 并 不 容易 。 源 代码 就 像 用 乐高 积木 搭建 的 作品 那样 ， 给 人 以 立体 感 。 
在 “实现 篇 ”中 ， 我 们 分 解 了 这 些 源 代码 ， 努 力 为 大 家 呈现 一 个 连续 的 故事 。 

此 外 ,我们 还 尽 可 能 地 每 次 都 引用 较 短 的 源 代码 ， 并 把 潜藏 在 源 代码 背后 的 “为 什么 ” 
也 写 出 来 。 
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除了 以 上 内 容 之 外 ， 本 书 中 还 尝试 了 各 种 各 样 的 挑战 。 当 然 也 有 几 次 失败 的 经 历 。 不 ， 
应 该 说 失败 经 历 比 成 功 经 历 更 多 一 些 …… 虽然 很 想 把 这 些 都 分 享 给 大 家 ， 但 是 不 得 不 收 笔 了 。 

我 是 在 3 年 前 开始 学 习 GC 的 ， 那 时 候 有 关 GC 的 日 语 资料 非常 少 ， 学 习 的 过 程 真 的 很 
艰难 。 就 这 样 过 了 3 年 ， 现 在 的 状况 跟 那 时 也 相差 无 几 。 如 果 3 年 前 就 有 本 书 的 话 ， 我 想 我 
肯定 会 毫 不 犹豫 地 买 下 吧 。 

我 已 经 没 法 把 本 书 送 给 过 去 的 我 了 ,但 是 我 可 以 把 本 书 分 享 给 现在 以 及 未 来 跟 我 有 相似 
经 历 的 人 。 而 我 之 所 以 参与 本 书 的 创作 ， 也 就 是 出 于 这 个 原因 。 

衷心 希望 本 书 能 到 需要 它 的 人 手中 。 
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